云无常形
4小时前在线
全职 · 300/日  ·  6525/月
工作时间: 工作日16:00-24:00工作地点:
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********

使用APP扫码聊一聊

个人介绍

“专注Python静态爬虫领域,擅长用requests、BeautifulSoup、lxml组合高效采集豆瓣影评、公开榜单等静态网页数据。精通静态页面解析逻辑,能将非结构化HTML转化为结构化数据,并通过 openpyxl 完成数据清洗与Excel存储。熟悉静态反爬规则(如请求头优化、频率控制),可稳定交付干净可用的静态数据成果。目前聚焦静态爬取类需求,期待为需要采集静态网页数据的项目提供专业服务,助力数据驱动决策。

工作经历

  • 2024-05-01 -至今自由爬虫工程师

    以 requests + BeautifulSoup / lxml 为核心工具,完成豆瓣电影影评、公开榜单等静态网页数据采集;聚焦静态页面解析,攻克复杂标签嵌套、多字段关联提取等难点,将非结构化HTML转化为结构化数据;通过 openpyxl 完成数据清洗与Excel存储,交付的豆瓣影评数据集覆盖2000+条有效记录,支撑后续分析场景。熟练掌握静态爬虫“请求发送→页面解析→数据存储”全流程,在反爬规避(如请求头优化、频率控制)上积累实战经验,可高效交付静态网页数据采集需求。

教育经历

  • 2016-09-01 - 2019-07-08贵州应用技术职业学院化学工程与技术专科已认证

技能

Python掌握
0
1
2
3
4
5
作品
豆瓣影评爬取(含简单清洗)

一、项目核心功能描述该项目是自动化豆瓣影评采集与数据整理工具,核心功能为定向爬取豆瓣电影的热门影评数据,对采集到的数据进行清洗处理后,最终以Excel表格形式结构化存储,方便后续分析使用。二、具体功能模块1.数据采集模块(核心爬取能力)2.数据解析与清洗模块3.数据存储模块4.程序控制模块(流程调度

0
2025-10-11 19:50
更新于: 8小时前 浏览: 30