大学在读书,时间充裕。
- 核心语言:熟练掌握 Python 基础语法与常用标准库
- 爬虫开发:精通 Requests、Scrapy 框架,可独立完成静态/动态网站数据爬取、清洗与存储
- Web开发:熟悉 Flask/Django 框架,能够搭建简单的后端服务与前端页面
- 数据可视化:掌握 Pandas 数据处理,以及 Matplotlib、Seaborn、Plotly 等可视化工具,可输出清晰的图表与分析报告
- 文档自动化:能利用 Python 生成结构化的 Excel、Word 及 PDF 文档,实现数据与报告的自动输出

本系统专为自动化采集房天下二手房数据设计,旨在解决人工搜集效率低的问题。核心功能:-深度采集:自动遍历前100页,精准提取标题、价格、户型、楼层、联系人等10+项核心字段。-强力反爬:集成TLS指纹模拟(`curl_cffi`)与动态User-Agent技术,有效绕过验证码与封禁,模拟真实用户行为。
12026-02-05 22:50