power
20小时前在线
全职 · 300/日  ·  6525/月
工作时间: 工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

中央财经大学 本科

一名专注于数据采集与逆向工程的技术实战派。具备深厚的Python爬虫开发经验,擅长处理简单反爬机制、高并发数据采集及大规模数据清洗。非科班出身但技术扎实,追求用代码高效解决实际问题。

核心技术栈

爬虫框架:精通 Requests

数据解析:精通 XPath、BeautifulSoup、正则表达式

逆向工程:熟练使用浏览器开发者工具进行JS逆向、API分析

并发处理:掌握多线程、异步IO提升采集效率

数据存储:熟悉 MySQL、MongoDB、CSV等数据持久化方案

工程化能力

代码规范:注重可读性和可维护性,注释完整

错误处理:完善的异常捕获和日志记录机制

性能优化:请求频率控制、连接复用、内存管理



工作经历

  • 2023-09-01 -至今中央财经大学学生

    独立承接数据采集项目,利用Python的Requests、BeautifulSoup库开发定向爬虫,成功为多个需求方采集并清洗结构化数据。 熟练处理反爬机制,使用多线程提升采集效率,数据准确率超95%。

教育经历

  • 2023-09-01 - 2025-11-02中央财经大学信息安全本科

语言

中文母语水平
英语无工具书面交流
0
1
2
3
4
5
0
1
2
3
4
5

技能

Python掌握
Java熟悉
0
1
2
3
4
5
0
1
2
3
4
5
作品
北京新发菜地网页信息采集

本系统采用多线程爬虫技术,自动批量采集新发地市场蔬菜价格数据。核心功能包括:多页自动翻页采集、JSON数据解析、价格数据提取过滤、CSV格式存储导出。系统支持并发请求提高采集效率,内置异常处理机制确保稳定运行,自动过滤指定日期的数据,并实时显示下载进度。输出标准化数据结构,包含蔬菜品类、名称、最低价

0
2025-11-02 22:54
猪八戒网页信息采集

该代码是一个专业的猪八戒网数据采集爬虫,专门用于批量获取服务需求信息。主要功能包括多页自动翻页采集、数据解析提取、CSV文件存储和进度监控。代码通过XPath精准定位页面元素,提取服务标题、价格、需求描述和详情链接等关键信息,并具备完善的错误处理机制。支持自定义采集页码范围,自动处理数据去重和格式转

0
2025-11-02 22:47
更新于: 21小时前 浏览: 2