Tatsumaki
10天前在线
全职 · 300/日  ·  6525/月
工作时间: 工作日14:00-23:00、周末14:00-23:00工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

我是程序员客栈的Tatsumaki,一名高级Python爬虫工程师(专注大规模数据采集与反爬对抗方向);


我毕业于清华大学 计算机科学与技术专业,目前担任北京深度机智科技 高级Python工程师;


负责过亿级分布式爬虫采集平台、高级反爬攻防与验证码破解系统、多源异构数据融合与AI数据服务引擎的开发;


熟练使用Python、Scrapy/Scrapy-Redis、Kubernetes、Kafka/RabbitMQ、Redis、JS逆向与AST解析、Selenium/自动化渲染等技术栈;


如果我能帮上您的忙,请点击“立即预约”或“发布需求”!

工作经历

  • 2024-06-10 -至今北京深度机智科技高级python工程师

    北京深度机智科技有限公司是一家专注于人工智能与大数据技术融合创新的高科技企业。公司核心业务涵盖智能舆情洞察、知识图谱构建、垂直领域大规模数据挖掘以及AI模型训练数据服务,致力于为金融、政务、零售等行业客户提供从海量数据采集、深度清洗到智能决策分析的全链路解决方案。公司自研了分布式数据采集平台与多源异构数据融合引擎,日均稳定处理亿级互联网公开数据,在反爬对抗、动态渲染及隐蔽数据抓取方面构筑了坚实的技术壁垒。 作为高级Python爬虫工程师,我的主要职责与工作内容如下: 1. 分布式爬虫系统架构设计:主导高可用、可弹性扩展的分布式爬虫框架的规划与迭代。基于Scrapy、Scrapy-Redis,结合Kubernetes及Kafka/RabbitMQ消息队列,构建起支持每日数亿级页面采集的集群,确保系统7×24小时稳定运行,并持续优化任务调度与去重策略,降低资源损耗。 2. 高级反爬攻防研究:深入分析目标平台的各类反爬手段,负责攻克JS混淆、AST代码变形、WebAssembly加密、滑块/点选/短信验证码识别、移动端应用API签名、浏览器指纹检测及行为验证等复杂防护。熟练运用Selen

教育经历

  • 2021-09-02 - 2024-06-04清华大学计算机科学与技术本科

    在清华大学攻读计算机科学与技术专业的本科经历,为我奠定了坚实的计算与软件开发学术基础。通过系统学习,我掌握了扎实的技术知识、解决问题的能力以及分析性思维,这使我能够胜任复杂的技术项目,并作为一名计算机科学专业人士持续成长。

语言

中文母语水平
0
1
2
3
4
5

技能

MySQL掌握
MongoDB掌握
Kafka熟练
RabbitMQ熟练
Redis熟练
Python精通
0
1
2
3
4
5
0
1
2
3
4
5
作品
分布式礼貌异步网络爬虫系统(Polite Async Crawler)

1.分布式前沿协调模块·SQLite单机租赁:默认使用SQLite管理任务队列、已访问集、重试计数和租赁状态。·Redis多节点支持:通过--frontier-backendredis启用,实现全局去重、分布式队列、租约和重试机制,多个爬虫节点共享同一Redis后端,避免重复抓取。2.礼貌爬取与协议

0
2026-06-03 18:11
更新于: 06-03 浏览: 9