个人介绍
拥有三年爬虫开发经验,曾在北京从事爬虫开发工作,担任爬虫项目组长,现在为南京阳光易联的高级爬虫师
曾主导完成多个千万级数据量级采集项目,具备项目统筹、团队任务分配与线上爬虫全生命周期管理能力。
精通 Web接口、WebSocket 直播协议逆向攻坚,熟练破解瑞数 5、加速乐、5s 盾、阿卡麦、数美滑块、图文 / 点选验证码、JS 混淆加密、京东 h5st 等各类主流 WAF 与风控体系,可借助 AI 快速还原浏览器运行环境、绕过平台设备校验与限流风控;独立落地抖音直播间实时弹幕采集、小红书店铺 / 种草图文批量起号采集、淘宝全量商品数据抓取、B 站 / YouTube 海量视频素材爬取、海外航司公开数据采集、Steam 登录转区逆向等商业实战项目。
熟练运用 Scrapy 搭建采集体系,掌握多线程高并发调度,能够统筹海量高频请求、大文件批量下载与大批量数据库写入优化;熟练使用 Ubuntu 服务器、Docker 容器化部署,基于 Crawlab 搭建分布式爬虫集群,长期独立维护自有业务服务器,完善日志监控、断点续爬、代理池调度机制,保障千万级数据项目长期稳定自动化采集。
工作经历
2025-07-01 -至今南京阳光易联高级逆向爬虫师
负责各类网站、APP 接口逆向分析,破解签名加密、JS 混淆、瑞数等 WAF 防护,还原请求逻辑,突破平台反爬限制,稳定获取公开业务数据。 统筹线上爬虫项目部署、运行与日常维护,处理封禁、断连、采集失败等线上故障,保障 7×24 小时数据定时采集任务正常运转。 迭代优化公司统一爬虫底层框架,重构调度、去重、代理池、持久化存储模块,提升并发效率,降低服务器资源消耗与封禁概率。 设计分布式采集方案,规范数据清洗、入库、日志监控流程,输出通用逆向工具类,支撑业务批量采集需求,沉淀反爬对抗解决方案。
教育经历
2021-07-07 - 2025-06-10南通理工学院计算机应用技术专科
资质认证
语言
技能

WebSocket协议逆向解析模块、多直播间协程并发模块、账号与设备指纹伪装模块、心跳保活自动重连模块、弹幕商品数据结构化模块、Redis任务调度模块、MySQL持久化存储与日志监控模块。主要功能描述逆向直播间二进制protobuf加密数据流,建立长连接毫秒级抓取弹幕、用户信息、弹窗带货商品、实时销




