通过抓包对json、html、xpath、css进行分析使用bs4模块、re模块、scrapy框架进行爬取,最终传入本地mysql爬取过程中效率低下,我使用IP池与多线程进行处理,实现快速爬取同时避免IP被封
评论