项目分为4个功能模块,分别实现提取目标网站源代码、定位目标数据标签、数据清洗整理和保存数据 使用了python,编写全部爬虫代码,成功获取百度热搜榜榜单(包括文字和数据) 难点在于保存数据,利用python的pandas
评论