基于汽车之家网站的爬虫程序,用户可输入汽车品牌名(如:奔驰),获取该汽车品牌名旗下所有型号汽车的基本信息,包括综合口碑评分,空间,驾驶感受,油耗,外观,内饰,性价比,配置,操控,舒适性,智能化,评论标题,评论具体内容,评论时间,查看人数,好评数,评论数,车型,购买目的等信息,将上述信息汇总到EXCEL表中,并进行数据统计。
实现过程:
1. 对目标网站进行抓包,分析网页结构,调查接口信息;
2. 使用python的request,PyQuery,faker等第三方包编写爬虫程序,具有下载网页,解析网页,获取信息,保存信息等功能;
3. 汇总所需信息,并进行数据统计,绘图。
点击空白处退出提示
评论