0
1
2
3
4
5
2015-03-10 -至今品高软件采集工程师
1.数据抓取开发 使用Python编写爬虫脚本(如requests、Scrapy、Selenium等框架),从网站、API、数据库等渠道高效获取结构化或非结构化数据。 处理动态网页(如JavaScript渲染页面)的反爬机制(验证码、IP封禁、请求频率限制等)。 2.反爬策略应对 分析目标网站的反爬策略,通过代理IP池、请求头伪装、User-Agent轮换、验证码识别等技术绕过限制。 设计分布式爬虫架构(如结合Redis、Kafka等),提升抓取效率和稳定性。 3.数据清洗与存储 对抓取的原始数据进行清洗、去重、格式化,提取关键字段。 将数据存储到数据库(如MySQL、MongoDB)或文件系统(CSV、JSON、Parquet等)
2011-08-29 - 2015-06-09河北科技大学计算机科学与技术本科