

全职 · 300/日 · 6525/月信用一般
工作时间: 工作日16:00-24:00工作地点:
服务企业:
0家累计提交:
0工时
联系方式:
********
********
********


个人介绍
“专注Python静态爬虫领域,擅长用requests、BeautifulSoup、lxml组合高效采集豆瓣影评、公开榜单等静态网页数据。精通静态页面解析逻辑,能将非结构化HTML转化为结构化数据,并通过 openpyxl 完成数据清洗与Excel存储。熟悉静态反爬规则(如请求头优化、频率控制),可稳定交付干净可用的静态数据成果。目前聚焦静态爬取类需求,期待为需要采集静态网页数据的项目提供专业服务,助力数据驱动决策。
工作经历
2024-05-01 -至今无自由爬虫工程师
以 requests + BeautifulSoup / lxml 为核心工具,完成豆瓣电影影评、公开榜单等静态网页数据采集;聚焦静态页面解析,攻克复杂标签嵌套、多字段关联提取等难点,将非结构化HTML转化为结构化数据;通过 openpyxl 完成数据清洗与Excel存储,交付的豆瓣影评数据集覆盖2000+条有效记录,支撑后续分析场景。熟练掌握静态爬虫“请求发送→页面解析→数据存储”全流程,在反爬规避(如请求头优化、频率控制)上积累实战经验,可高效交付静态网页数据采集需求。
教育经历
2016-09-01 - 2019-07-08贵州应用技术职业学院化学工程与技术专科已认证
技能
Python掌握
0
1
2
3
4
5