爬虫4步骤,第一,请求地址,第二,获取数据,第三,解析数据,第四,保存数据, 部分网址需要构建代理池,验证码识别,利用多线程等等方式。爬取数据一般用,xpth,正则,css。根据实际情况具体分析,获取目标需求。
评论