proginn2330305187
18小时前在线
全职 · 500/日  ·  10875/月
工作时间: 工作日19:00-22:00、周末08:00-17:00工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

我毕业于中山大学智能科学与技术专业,目前在攻读北京师范大学基础数学硕士学位。在校期间曾于中科院自动化研究所实习,参与3D点云生成项目的CUDA加速研发,积累了高性能计算与系统优化的底层能力。

我热爱用技术解决实际问题,Python是我的主力语言。业余时间独立开发了四个完整的数据采集与文本分析工具:

豆瓣电影数据爬取与分析工具:基于curl_cffi模拟浏览器指纹,配合手动登录态维持,爬取Top250电影信息与短评,并集成SnowNLP情感分析、LDA主题建模与词云可视化,提供完整的文本分析能力。链家二手房数据采集工具:使用Playwright实现浏览器自动化,绕过反爬机制,配合自研的字段解析引擎精准提取户型、面积、朝向、装修等结构化数据。小红书评论爬虫与智能分析系统:完整抓取笔记主评论与多级回复,自动解析相对时间,情感分析、词云、LDA主题三重分析一步到位。智联招聘校招岗位采集工具:面对JS动态渲染与反爬校验,实现了从轻量级curl_cffi到Playwright的方案演进,包含列表采集与详情页深度抓取两阶段。

我的优势在于:既有数学专业的逻辑严谨性,又有工程落地的动手能力。我深知数据采集不是简单的“发请求、拿数据”,而是需要综合应对反爬策略、数据清洗、存储设计和后续分析的完整链路。我习惯写结构清晰、可维护的代码,并提供完善的文档。

我目前利用课余时间承接爬虫开发、数据分析、自动化脚本等外包项目。我希望能用技术为你的业务提供稳定、高效的数据能力支撑,价格合理、交付靠谱,期待合作。

工作经历

  • 2025-07-01 -至今北京市第十一中学中学数学教师

    负责初中数学教学,同时使用python、html等信息技术教育教学教研工作。在课余时间独立开发了多个数据采集与分析工具,包括豆瓣电影评论分析系统、链家二手房数据采集工具、小红书评论爬虫与情感分析平台、智联招聘校招岗位采集工具等,将编程技能与教学实践相结合,指导学生通过Python进行数据分析和可视化,培养学生计算思维能力。

教育经历

  • 2022-09-01 - 2025-06-01北京师范大学基础数学硕士

    主修课程:实分析、泛函分析、概率论基础、智能计算、数据挖掘、数字图像处理和分析 校内荣誉:2022-2023年度研究生学业一等奖学金(学术硕士);2023-2024(二)学期本科优秀助教

  • 2017-09-01 - 2021-06-01中山大学智能科学与技术本科

    主修课程:高等数学、线性代数、概率统计、程序设计、高级语言程序设计、项目管理、运筹学、系统优化

资质认证

语言

中文母语水平
英语可口语交流
0
1
2
3
4
5
0
1
2
3
4
5

技能

C++熟练
Python精通
MySQL掌握
Torch熟练
0
1
2
3
4
5
0
1
2
3
4
5
作品
智联招聘校园招聘岗位数据采集工具

本工具包含三个核心阶段,形成完整的采集闭环:1.身份凭证持久化模块(record-headers.py):基于Playwright启动有头浏览器,引导用户手动登录智联招聘校园版,自动导出Cookies、User‑Agent及通用请求头,保存为本地文件(cookies.pkl、identity.jso

0
2026-06-22 21:04
下载次数:0
¥200
小红书笔记评论爬虫与智能分析系统

本系统采用模块化分层设计,涵盖爬取、存储、分析三大核心板块,具体功能如下:1.高级反检测爬虫模块(scraper/):-基于Playwright启动真实Chromium浏览器,注入反自动化脚本(遮蔽navigator.webdriver),随机化视口大小和User‑Agent。-支持持久化登录态(u

0
2026-06-22 20:46
链家二手房房源数据采集工具

本工具包含四大核心功能模块,形成了从“启动”到“入库”的完整闭环:1.持久化身份与环境管理模块:基于Playwright的launch_persistent_context,将浏览器登录态(含Cookies和LocalStorage)保存至本地profile目录。首次登录后,后续运行自动加载,彻底免

0
2026-06-22 20:37
下载次数:0
¥200
更新于: 1天前 浏览: 3