个人介绍
我是程序员客栈的Hy爬虫,一名自由职业者; 熟练使用XPath/bs4+正则双解析方案应对动态页面结构,解决封禁问题
通过Selenium,DrissionPage自动化模拟登录获取加密数据
多线程提高获取效率
如果我能帮上您的忙,请点击“立即预约”或“发布需求”!
工作经历
2024-10-10 -至今接单群自由职位
1,需求分析与方案设计:与客户沟通爬取需求,分析目标网站结构、反爬机制,制定最优爬取策略。 2,数据采集与清洗:使用Python(Requests/Selenium等)开发爬虫,处理动态页面、加密参数等问题,确保数据完整性和准确性。 3,反爬对抗与优化:应对IP封禁、请求频率限制、JS加密等反爬手段,采用代理IP池、请求伪装、浏览器自动化等技术绕过检测。 4,数据存储与交付:将采集的数据存入CSV格式,并按客户需求进行清洗、去重、结构化处理。 5,性能优化与维护:优化爬虫效率(多线程/异步/分布式),监控运行状态,修复因网站改版导致的解析失败问题,确保长期稳定运行。 6,典型项目:电商商品抓取、社交媒体舆情监控、金融数据聚合、企业信息采集等,满足客户在数据分析、竞品监测、市场研究等方面的需求。
教育经历
2023-09-08 - 湖南大众传媒云计算专科
技能
Python掌握
0
1
2
3
4
5



