一个网页爬虫程序,涉及到JS逆向,HTML解析,MongoDB等,使用的是Scrapy框架
爬虫类的项目远不止网络请求这么简单,selenium浏览器爬取,分布式爬取,验证码过检,持久化登录等,都可扩展
拿到数据后,还可使用pandas、numpy等框架进行数据处理与分析
如果有必要的话,还能使用Pyqt5打包为GUI程序,更方便用户一键调用
点击空白处退出提示
一个网页爬虫程序,涉及到JS逆向,HTML解析,MongoDB等,使用的是Scrapy框架
爬虫类的项目远不止网络请求这么简单,selenium浏览器爬取,分布式爬取,验证码过检,持久化登录等,都可扩展
拿到数据后,还可使用pandas、numpy等框架进行数据处理与分析
如果有必要的话,还能使用Pyqt5打包为GUI程序,更方便用户一键调用




评论