深海咸鱼
36分钟前在线
全职 · 300/日  ·  6525/月
工作时间: 工作日19:00-24:00、周末08:30-24:00工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

拥有三年爬虫开发经验,曾在北京从事爬虫开发工作,担任爬虫项目组长,现在为南京阳光易联的高级爬虫师

曾主导完成多个千万级数据量级采集项目,具备项目统筹、团队任务分配与线上爬虫全生命周期管理能力。

精通 Web接口、WebSocket 直播协议逆向攻坚,熟练破解瑞数 5、加速乐、5s 盾、阿卡麦、数美滑块、图文 / 点选验证码、JS 混淆加密、京东 h5st 等各类主流 WAF 与风控体系,可借助 AI 快速还原浏览器运行环境、绕过平台设备校验与限流风控;独立落地抖音直播间实时弹幕采集、小红书店铺 / 种草图文批量起号采集、淘宝全量商品数据抓取、B 站 / YouTube 海量视频素材爬取、海外航司公开数据采集、Steam 登录转区逆向等商业实战项目。


熟练运用 Scrapy 搭建采集体系,掌握多线程高并发调度,能够统筹海量高频请求、大文件批量下载与大批量数据库写入优化;熟练使用 Ubuntu 服务器、Docker 容器化部署,基于 Crawlab 搭建分布式爬虫集群,长期独立维护自有业务服务器,完善日志监控、断点续爬、代理池调度机制,保障千万级数据项目长期稳定自动化采集。

工作经历

  • 2025-07-01 -至今南京阳光易联高级逆向爬虫师

    负责各类网站、APP 接口逆向分析,破解签名加密、JS 混淆、瑞数等 WAF 防护,还原请求逻辑,突破平台反爬限制,稳定获取公开业务数据。 统筹线上爬虫项目部署、运行与日常维护,处理封禁、断连、采集失败等线上故障,保障 7×24 小时数据定时采集任务正常运转。 迭代优化公司统一爬虫底层框架,重构调度、去重、代理池、持久化存储模块,提升并发效率,降低服务器资源消耗与封禁概率。 设计分布式采集方案,规范数据清洗、入库、日志监控流程,输出通用逆向工具类,支撑业务批量采集需求,沉淀反爬对抗解决方案。

教育经历

  • 2021-07-07 - 2025-06-10南通理工学院计算机应用技术专科

资质认证

语言

中文母语水平
英语借工具书面交流
0
1
2
3
4
5
0
1
2
3
4
5

技能

Python熟练
0
1
2
3
4
5
0
1
2
3
4
5
作品
抖音直播间实时弹幕数据采集

WebSocket协议逆向解析模块、多直播间协程并发模块、账号与设备指纹伪装模块、心跳保活自动重连模块、弹幕商品数据结构化模块、Redis任务调度模块、MySQL持久化存储与日志监控模块。主要功能描述逆向直播间二进制protobuf加密数据流,建立长连接毫秒级抓取弹幕、用户信息、弹窗带货商品、实时销

0
2026-07-01 00:39
小红书逆向图文采集系统

1、项目具体功能模块分为接口逆向解密模块、分布式任务调度模块、代理IP池管理模块、图文异步下载模块、数据持久化存储模块、断点续爬与异常监控模块、图片自动分类归档模块。2、主要功能描述自动逆向小红书鉴权、签名加密规则,批量分页抓取笔记标题、文案、标签、发布时间等结构化数据;自动绕过图片防盗链批量下载高

0
2026-07-01 00:36
更新于: 9小时前 浏览: 3