proginn1552033519-广州小程序-程序员客栈

1月前来过

D级

爬虫

广州

全职 · 500/日 · 10875/月信用正常

工作时间: 工作日14:30-22:00工作地点: 远程

服务企业: 0家累计提交: 0工时

立即雇佣

聊一聊

APP聊一聊

去下载APP

主页

1. 个人简介 (Bio)

资深爬虫开发工程师 / 数据解决方案专家

我专注于公开合规数据的采集与深度挖掘，拥有超过【X】年的 Python 爬虫开发经验。擅长攻克反爬机制、分布式架构部署及海量数据清洗，能为您提供从数据采集到 API 封装的一站式全栈解决方案。

2. 核心技能 (Skills)

• 爬虫技术： Python (Scrapy / Requests / BeautifulSoup / Selenium), Aiohttp 异步爬虫，Playwright 自动化爬取

• 反爬对抗： IP 代理池维护、Cookie/Token 自动维护、验证码识别、动态 JS 渲染解析

• 数据处理：数据清洗、结构化存储 (MySQL / PostgreSQL / MongoDB)、Excel/CSV 批量导出

• 部署运维：服务器部署 (Linux), 定时任务 (Crontab), 监控告警，高并发分布式爬虫架构

2023-01-01 -至今Google爬虫
项目一：【大型电商评论数据采集系统】 • 角色：独立开发 • 描述：针对某头部电商平台，设计并实现了高并发分布式爬虫系统。解决了动态 JS 加密、滑块验证码及 IP 封禁问题。 • 成果：日均采集评论数据 50W+ 条，稳定运行 6 个月以上，数据准确率达 99%。 • 技术栈： Python + Scrapy-Redis + Redis + MySQL + Proxy Pool 项目二：【招聘信息聚合与分析工具】 • 角色：独立开发 • 描述：抓取主流招聘平台的岗位信息，进行关键词清洗与薪资分析。 • 成果：帮助客户快速生成行业分析报告，支持导出多格式 Excel 文件。 • 技术栈： Python + Selenium + Pandas 项目三：【社交媒体舆情监控爬虫】 • 角色：核心开发 • 描述：定制化抓取特定关键词的舆情数据，支持实时监控与增量更新。 • 成果：完成 10+ 站点的适配，支持动态翻页与反爬策略。

2015-07-01 - 2019-07-01电子科技大学爬虫本科
核心课程与主修 • 计算机基础：数据结构与算法、计算机网络、操作系统、数据库原理 • 软件开发： Python 编程、Web 前端开发 (HTML/CSS/JS)、软件工程 • 数据科学：数据库设计、数据挖掘与分析、机器学习基础

中文母语水平

Python熟练

作品

招聘信息聚合与分析小助手

作品三：招聘信息聚合与分析小助手?核心能力：爬虫定时任务、数据可视化、批量导出•项目描述：一个自用的聚合工具，定期抓取主流招聘网站上的特定岗位数据，用于分析行业薪资水平与技能需求。•技术亮点：◦设计定时任务(Crontab)，实现每日自动增量抓取。◦使用Pandas进行数据清洗与分析，自动剔除重复与

2026-03-19 16:40

动态网页数据提取工具

作品二：动态网页数据提取工具?核心能力：JS逆向、Playwright自动化、数据API封装•项目描述：针对某资讯/博客类网站，该网站采用前端框架渲染数据，常规请求无法直接获取内容。•技术亮点：◦采用Playwright进行浏览器自动化模拟，解决动态JS渲染难题。◦分析接口加密参数，通过Python

2026-03-19 16:38

多线程电商评论爬虫

作品一：多线程电商评论爬虫?核心能力：通用爬虫架构、数据清洗、并发处理•项目描述：针对某主流电商平台，开发的批量抓取商品评论与评分数据的工具。旨在帮助运营人员快速收集市场反馈进行竞品分析。•技术亮点：◦使用Python+Aiohttp实现异步高并发请求，大幅提升抓取效率。◦内置自动反爬机制，包括代理

2026-03-19 16:34

更新于: 03-19 浏览: 61

个人介绍

工作经历

教育经历

语言

技能

相似推荐换一批

重点城市程序员兼职推荐

重点岗位程序员兼职推荐