小王
1天前在线
全职 · 300/日  ·  6525/月
工作时间: 工作日8:00-10:00工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

我是Python爬虫开发者,熟练使用requests、BeautifulSoup、selenium等爬虫工具。

【技能】
- 网页数据采集:静态网站、分页爬取、动态内容
- 数据清洗:去除符号、格式化、去重
- 模拟登录***手机验证码登录
- 数据导出:CSV、Excel、JSON

【案例】
- 图书网站:爬取1000+本书,自动分页、价格清洗
- 知乎:模拟登录,获取登录后首页内容
- 电商网站:爬取商品名称、价格、图片链接

【可提供服务】
- 网站数据采集
- 数据清洗整理
- 爬虫脚本开发
- 导出表格文件

诚信靠谱,沟通及时,交付后免费修改一次。

工作经历

  • 2025-01-01 -至今个人开发者Python爬虫工程师

    2025年至今 自由职业Python爬虫开发者 - 独立完成图书网站全站数据采集(1000+条) - 独立完成知乎模拟登录与首页内容采集 - 独立完成电商网站商品信息采集(含图片链接)

教育经历

  • 2025-01-01 - 自学Python爬虫开发初中及以下

    自学Python爬虫开发,系统学习requests、BeautifulSoup、selenium等爬虫工具。已独立完成图书网站全站数据采集(1000+条)、知乎模拟登录、电商商品采集(含图片链接)等项目。具备数据清洗、CSV导出、异常处理等实战能力。

技能

Python掌握
0
1
2
3
4
5
作品
微博热搜榜动态爬虫

1.数据采集模块:使用selenium自动化框架,打开Chrome浏览器访问微博热搜页面。2.动态加载处理:自动滚动页面到底部,触发JavaScript加载更多热搜内容。3.数据解析模块:通过CSS选择器定位热搜排名和关键词元素,提取文本内容。4.数据存储模块:将爬取的热搜数据保存为CSV格式文件,

0
2026-04-01 12:29
知乎模拟登录与首页采集

1.模拟登录模块:使用selenium自动化框架,模拟*扫码登录流程。2.页面等待模块:设置智能等待,确保页面元素加载完成。3.内容采集模块:获取登录成功后的首页动态内容。4.数据保存模块:将采集的HTML内容保存到本地文件。5.异常处理模块:处理验证码、网络超时等异常情况。

0
2026-03-29 21:27
图书网站全站数据采集(1000+本)

1.数据采集模块:使用requests库发送HTTP请求,获取网页HTML内容。2.网页解析模块:使用BeautifulSoup解析HTML,提取书名和价格信息。3.分页处理模块:自动识别页码,循环爬取所有页面,共采集1000+条数据。4.数据清洗模块:使用正则表达式(re)清洗价格,去除货币符号,

0
2026-03-29 21:05
更新于: 03-30 浏览: 27