Hy爬虫
1月前来过
全职 · 300/日  ·  6525/月
工作时间: 工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

我是程序员客栈的Hy爬虫,一名自由职业者; 熟练使用XPath/bs4+正则双解析方案应对动态页面结构,解决封禁问题

通过Selenium,DrissionPage自动化模拟登录获取加密数据

多线程提高获取效率

如果我能帮上您的忙,请点击“立即预约”或“发布需求”!

工作经历

  • 2024-10-10 -至今接单群自由职位

    1,需求分析与方案设计:与客户沟通爬取需求,分析目标网站结构、反爬机制,制定最优爬取策略。 2,数据采集与清洗:使用Python(Requests/Selenium等)开发爬虫,处理动态页面、加密参数等问题,确保数据完整性和准确性。 3,反爬对抗与优化:应对IP封禁、请求频率限制、JS加密等反爬手段,采用代理IP池、请求伪装、浏览器自动化等技术绕过检测。 4,数据存储与交付:将采集的数据存入CSV格式,并按客户需求进行清洗、去重、结构化处理。 5,性能优化与维护:优化爬虫效率(多线程/异步/分布式),监控运行状态,修复因网站改版导致的解析失败问题,确保长期稳定运行。 6,典型项目:电商商品抓取、社交媒体舆情监控、金融数据聚合、企业信息采集等,满足客户在数据分析、竞品监测、市场研究等方面的需求。

教育经历

  • 2023-09-08 - 湖南大众传媒云计算专科

技能

Python掌握
0
1
2
3
4
5
作品
Hy

主要帮客户获取想要的数据,比如某电商平台商品价格,折扣等信息, 使用XPath+正则双解析方案应对动态页面结构,解决封禁问题,使用多线程提升获取效率 通过Selenium,DrissionPage自动化模拟登录获取加密数据,

0
2025-04-29 12:08
更新于: 2025-04-29 浏览: 28