项目介绍:
客户为了开发市场需要竞品平台的所有产品资料。
项目成果:
在该网站上采集到约3w条产品的相关信息、主配图和辅配图链接,产品信息整理为excel,图片编号打包发给客户。
主要技术:
利用selenium、requests和bs4分步提取整个商城的类目框架及每个产品链接,再通过链接使用多线程采集,检验并破解网站的反爬机制,最终获得所有商品信息和图例。
点击空白处退出提示
项目介绍:
客户为了开发市场需要竞品平台的所有产品资料。
项目成果:
在该网站上采集到约3w条产品的相关信息、主配图和辅配图链接,产品信息整理为excel,图片编号打包发给客户。
主要技术:
利用selenium、requests和bs4分步提取整个商城的类目框架及每个产品链接,再通过链接使用多线程采集,检验并破解网站的反爬机制,最终获得所有商品信息和图例。
评论