解决数据采集整理的难点,大批量采集数据的难点,破解反爬机制爬取数据,使用代理ip等
点击空白处退出提示
解决数据采集整理的难点,大批量采集数据的难点,破解反爬机制爬取数据,使用代理ip等
项目主要是爬取各个网站的数据,清洗出来并且保存在本地文件包括(视频,音频,文字,主要用到了,模拟游览器发送请求的requests,模拟人在电脑上操作的DrissionPage,re正切,random随机模块,for循环,while循环,处理视频的os模块,tqdm下载可视化等模块
所有代码的编写和数据的处理采集,使用DrissionPage模拟人操作网页,通过数据缓存跳过一些登录界面,有效防止反爬






评论