个人介绍
我毕业于中山大学智能科学与技术专业,目前在攻读北京师范大学基础数学硕士学位。在校期间曾于中科院自动化研究所实习,参与3D点云生成项目的CUDA加速研发,积累了高性能计算与系统优化的底层能力。
我热爱用技术解决实际问题,Python是我的主力语言。业余时间独立开发了四个完整的数据采集与文本分析工具:
豆瓣电影数据爬取与分析工具:基于curl_cffi模拟浏览器指纹,配合手动登录态维持,爬取Top250电影信息与短评,并集成SnowNLP情感分析、LDA主题建模与词云可视化,提供完整的文本分析能力。链家二手房数据采集工具:使用Playwright实现浏览器自动化,绕过反爬机制,配合自研的字段解析引擎精准提取户型、面积、朝向、装修等结构化数据。小红书评论爬虫与智能分析系统:完整抓取笔记主评论与多级回复,自动解析相对时间,情感分析、词云、LDA主题三重分析一步到位。智联招聘校招岗位采集工具:面对JS动态渲染与反爬校验,实现了从轻量级curl_cffi到Playwright的方案演进,包含列表采集与详情页深度抓取两阶段。我的优势在于:既有数学专业的逻辑严谨性,又有工程落地的动手能力。我深知数据采集不是简单的“发请求、拿数据”,而是需要综合应对反爬策略、数据清洗、存储设计和后续分析的完整链路。我习惯写结构清晰、可维护的代码,并提供完善的文档。
我目前利用课余时间承接爬虫开发、数据分析、自动化脚本等外包项目。我希望能用技术为你的业务提供稳定、高效的数据能力支撑,价格合理、交付靠谱,期待合作。
工作经历
2025-07-01 -至今北京市第十一中学中学数学教师
负责初中数学教学,同时使用python、html等信息技术教育教学教研工作。在课余时间独立开发了多个数据采集与分析工具,包括豆瓣电影评论分析系统、链家二手房数据采集工具、小红书评论爬虫与情感分析平台、智联招聘校招岗位采集工具等,将编程技能与教学实践相结合,指导学生通过Python进行数据分析和可视化,培养学生计算思维能力。
教育经历
2022-09-01 - 2025-06-01北京师范大学基础数学硕士
主修课程:实分析、泛函分析、概率论基础、智能计算、数据挖掘、数字图像处理和分析 校内荣誉:2022-2023年度研究生学业一等奖学金(学术硕士);2023-2024(二)学期本科优秀助教
2017-09-01 - 2021-06-01中山大学智能科学与技术本科
主修课程:高等数学、线性代数、概率统计、程序设计、高级语言程序设计、项目管理、运筹学、系统优化
资质认证
语言

本工具包含三个核心阶段,形成完整的采集闭环:1.身份凭证持久化模块(record-headers.py):基于Playwright启动有头浏览器,引导用户手动登录智联招聘校园版,自动导出Cookies、User‑Agent及通用请求头,保存为本地文件(cookies.pkl、identity.jso

本系统采用模块化分层设计,涵盖爬取、存储、分析三大核心板块,具体功能如下:1.高级反检测爬虫模块(scraper/):-基于Playwright启动真实Chromium浏览器,注入反自动化脚本(遮蔽navigator.webdriver),随机化视口大小和User‑Agent。-支持持久化登录态(u





