

全职 · 300/日 · 6525/月信用一般
工作时间: 工作日18:00-22:00、周末08:00-22:00工作地点:
远程
服务企业:
0家累计提交:
0工时
联系方式:
********
********
********


聊一聊
个人介绍
我是程序员客栈的劫难,计算机硕士,一名专注于高难度数据采集的Python爬虫工程师。
主导项目
▋ Elsevier期刊作者信息采集系统(分布式爬虫/反爬对抗)
▋ 跨境电商评论实时监控平台(异步爬取/JS逆向)
▋ 学术画像数据清洗管道(Pandas/特征去重算法)
核心技术栈
√ Python生态:Scrapy/Requests-HTML/PySpider深度优化
√ 反爬体系:Selenium/Playwright自动化 | MitmProxy中间人 | 分布式IP池
√ 数据处理:XPath/Regex精准解析 | Kafka实时清洗 | MySQL/MongoDB存储
√ 部署运维:Docker集群化调度 | Prometheus监控 | 日志溯源系统
擅长从数据源分析到存储落地的完整解决方案设计,注重代码健壮性与数据合规性。
立即预约,获取可免费试跑的爬虫Demo!
工作经历
2025-02-01 -至今一窗研究院算法工程师
政务服务数字化、政策大数据应用、人工智能场景落地。工作内容:政务数据采集、反爬对抗专项、数据治理与合规、特色技术需求
教育经历
2022-09-01 - 2025-01-07北方民族大学人工智能硕士
2018-09-01 - 2022-07-01陕西理工大学信息与计算科学专业本科
语言
普通话
0
1
2
3
4
5
技能
0
1
2
3
4
5