https://nutridata.cn平台25667条食谱数据、10732条菜品图片全量爬取,为用户饮食推荐做基础。
点击空白处退出提示
https://nutridata.cn平台25667条食谱数据、10732条菜品图片全量爬取,为用户饮食推荐做基础。
通过对应的网页格式找到规律后使用selenium库进行自动化爬取。
爬取菜品名称、成分、计量单位、图片地址(动态的,一段时间会失效)、本地图片路径、菜肴做法、能量及宏量营养素、维生素、矿物质、单位量。
主要爬取"名称"、"能量"、"分类"、等作为数据对应和关联辅助。
基于Python+Selenium,突破反爬机制,拿到官网html所有内容,使用正则表达式提取相对应数据,完成爬取相应饮食数据。




评论