使用 Scrapy, 爬几个电子书网站

我要开发同款
fanchuang2021年03月28日
68阅读

作品详情

1. 思路: 按类目,一层一层地解析目标网站,找到没一本书的实际内容。2. 保存: 按照实际章节的顺序,来保存每一本书。三个网站:1. 武侠:从下载一本书, 到下载一个类目的图书,再到下载全站的图书。2. 99藏书网: 由于原始 html 里面是加盐的,因此需要借助 selenium 来获取 js 处理过的页面。3. 努努书坊: 每本书的内容还是很完整的,只是大部分类型我不喜欢。
查看全文
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论