个人介绍
资深爬虫开发工程师 / 数据解决方案专家
我专注于公开合规数据的采集与深度挖掘,拥有超过【X】年的 Python 爬虫开发经验。擅长攻克反爬机制、分布式架构部署及海量数据清洗,能为您提供从数据采集到 API 封装的一站式全栈解决方案。
2. 核心技能 (Skills)
• 爬虫技术: Python (Scrapy / Requests / BeautifulSoup / Selenium), Aiohttp 异步爬虫,Playwright 自动化爬取
• 反爬对抗: IP 代理池维护、Cookie/Token 自动维护、验证码识别、动态 JS 渲染解析
• 数据处理: 数据清洗、结构化存储 (MySQL / PostgreSQL / MongoDB)、Excel/CSV 批量导出
• 部署运维: 服务器部署 (Linux), 定时任务 (Crontab), 监控告警,高并发分布式爬虫架构
工作经历
2023-01-01 -至今Google爬虫
项目一:【大型电商评论数据采集系统】 • 角色: 独立开发 • 描述: 针对某头部电商平台,设计并实现了高并发分布式爬虫系统。解决了动态 JS 加密、滑块验证码及 IP 封禁问题。 • 成果: 日均采集评论数据 50W+ 条,稳定运行 6 个月以上,数据准确率达 99%。 • 技术栈: Python + Scrapy-Redis + Redis + MySQL + Proxy Pool 项目二:【招聘信息聚合与分析工具】 • 角色: 独立开发 • 描述: 抓取主流招聘平台的岗位信息,进行关键词清洗与薪资分析。 • 成果: 帮助客户快速生成行业分析报告,支持导出多格式 Excel 文件。 • 技术栈: Python + Selenium + Pandas 项目三:【社交媒体舆情监控爬虫】 • 角色: 核心开发 • 描述: 定制化抓取特定关键词的舆情数据,支持实时监控与增量更新。 • 成果: 完成 10+ 站点的适配,支持动态翻页与反爬策略。
教育经历
2015-07-01 - 2019-07-01电子科技大学爬虫本科
核心课程与主修 • 计算机基础: 数据结构与算法、计算机网络、操作系统、数据库原理 • 软件开发: Python 编程、Web 前端开发 (HTML/CSS/JS)、软件工程 • 数据科学: 数据库设计、数据挖掘与分析、机器学习基础
语言
技能

作品三:招聘信息聚合与分析小助手?核心能力:爬虫定时任务、数据可视化、批量导出•项目描述:一个自用的聚合工具,定期抓取主流招聘网站上的特定岗位数据,用于分析行业薪资水平与技能需求。•技术亮点:◦设计定时任务(Crontab),实现每日自动增量抓取。◦使用Pandas进行数据清洗与分析,自动剔除重复与

作品二:动态网页数据提取工具?核心能力:JS逆向、Playwright自动化、数据API封装•项目描述:针对某资讯/博客类网站,该网站采用前端框架渲染数据,常规请求无法直接获取内容。•技术亮点:◦采用Playwright进行浏览器自动化模拟,解决动态JS渲染难题。◦分析接口加密参数,通过Python






