项目简介:
段子数据采集,对网站上段子作者,段子内容,点赞数据,不喜欢数据进行采集
项目架构:
Scrapy框架+pymysql+pandas+Xpath
技术描述:
1.使用Scrapy框架对数据进行采集
2.使用xpath插件分析数据特征,对数据进行提取
3.添加请求头,Cookie,IP代理等信息,解决反扒问题
4.使用Git代码版本工具对项目代码进行管理
5.使用PyMysql将数据存储到Mysql数据库中
6.使用numpy对数据进行处理
点击空白处退出提示













评论