使用requests,re,os,urllib模块来对数据进行抓取并清理。设置请求url,请求头模拟浏览器访问页面,并得到源数据,再用re来进行数据提取,然后创建文件(可建立数据库,入库),并将数据存入指定文件或数据库。
评论