数据爬取
1月前来过
全职 · 500/日  ·  10875/月
工作时间: 工作日09:00-21:00、周末09:00-21:00工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

专注于大数据处理和网络爬虫技术。我对爬虫逆向工程技术有深入研究,擅长通过分析和破解网站的反爬机制。我熟练掌握Python、Js等编程语言,能够灵活运用Scrapy、xpath,正则,等主流爬虫框架,并结合selenium自动化 或 JavaScript渲染、动态IP代理、模拟登录、验证码识别等多种策略解决复杂网络爬取问题。同时,我也非常注重遵守相关法律,保证数据获取的合法性与道德性。

工作经历

  • 2022-07-01 -至今京东数据爬取

    从事网页 数据采集的技术研发工作;负责设计爬虫策略及反爬规则,提升数据采集效率、完整度和稳定性;负责智能采集系统设计与研发,如采集任务调度,页面解析和结构化抽取,海量数据存储和读取等

教育经历

  • 2010-03-01 - 2014-07-01河北工业职业技术学院计算机科学与技术专科

    技术学院计算机应用技术专业。在专科学习阶段,我系统地学习了计算机基础理论知识,包括数据结构、数据库管理、网络编程、软件工程以及Web开发等核心课程。在校期间,我积极参与各类项目实践。

技能

爬虫
0
1
2
3
4
5
作品
scrape数据

scrape数据采用了时间戳shi1加密 先用时间戳加网页后缀加的用的shi1加密,在用base64把shi1的加密结果加时间戳进行了转码。

0
2024-03-04 17:06
艺恩电影

影视数据分析 1. 实时票房数据:包含单部影片的每日、每周、每月乃至每年的票房收入。 2. 影院数据:各个影院的票房表现、场次、观影人次、平均票价等运营数据。 3. 电影排行榜:各类别、时段、地区的电影排名情况。 4. 市场分析报告:深度分析市场趋势、观众画像、影片类型偏好等。 使用Python编程语言进行艺恩电影数据的抓取。

0
2024-03-04 17:00
爬取企名片数据

爬取企名片的公开数据,这个网站用了JS文字加密反爬。使用随机设备。爬取这个标头信息,发表时间信息,图片的Url。文本内容。

0
2024-03-04 16:12
更新于: 03-04 浏览: 61