核心功能:
1. 自动化爬取某大型旅游网站的景点数据,包括图片、位置、介绍、开关门时间、评论等等,总共数万条。
2. 对数据进行校验、清理、存储、定期更新。
采用技术:
1. JS脱壳、反混淆、反反爬
2. 伪造请求,CSRF
3. python, mysql, sqlite, 多线程
编写爬虫的全部代码;测试,运行以及部署。最终成功获得了两万条数据,包含景点的评论、介绍、经纬度、图片链接、开关门时间等等。部分数据涉及敏感信息,不予展示。
点击空白处退出提示
核心功能:
1. 自动化爬取某大型旅游网站的景点数据,包括图片、位置、介绍、开关门时间、评论等等,总共数万条。
2. 对数据进行校验、清理、存储、定期更新。
采用技术:
1. JS脱壳、反混淆、反反爬
2. 伪造请求,CSRF
3. python, mysql, sqlite, 多线程
编写爬虫的全部代码;测试,运行以及部署。最终成功获得了两万条数据,包含景点的评论、介绍、经纬度、图片链接、开关门时间等等。部分数据涉及敏感信息,不予展示。





评论