项目描述:此项目是一个爬取小某书的项目,可根据需要爬取小某书里的各项内容包括用户、标签下的笔记等等内容。主要工作: 1、数据采集:分析http请求,确保笔记数据所在的位置;2、数据清洗:对爬取到的数据进行结构分析,筛选所需的数据;3、数据呈现:1.直接导入excel表格;2.配合django,将数据简单呈现在网页上可供直接点击访问。
评论