根据客户要求,需要爬取某点评网的美食店铺信息,包括:店铺id,店铺名称,电话,评分,星级,地址,营业时间,店铺类型,经纬度,推荐菜品。
1.根据需求搭建爬虫框架,并分析解析网页;
2.设置ip代理池,开启redis服务做缓存和去重;
3.某点评网使用了css字体加密,所以使用fontTools和字体工具解析字体文件,得到明文和暗文的对应关系;
4.根据对应关系替换原网页的内容,抓取所需信息;
5.根据数据内容设计并创建数据库表,保存数据到数据库。
点击空白处退出提示
根据客户要求,需要爬取某点评网的美食店铺信息,包括:店铺id,店铺名称,电话,评分,星级,地址,营业时间,店铺类型,经纬度,推荐菜品。
1.根据需求搭建爬虫框架,并分析解析网页;
2.设置ip代理池,开启redis服务做缓存和去重;
3.某点评网使用了css字体加密,所以使用fontTools和字体工具解析字体文件,得到明文和暗文的对应关系;
4.根据对应关系替换原网页的内容,抓取所需信息;
5.根据数据内容设计并创建数据库表,保存数据到数据库。
评论