jyeoo 为第一版爬虫基于scrapy + splash
1.账号使用api.jyeoo.com后台接口自动登陆 由于账号被封,此方法废弃,改用手动登陆获取cookie方式
2.vip账号爬取次数过多发生被封号,爬取次数规则未摸清
3.jyeoo后台检测机制使账号发生课题和解析内容不一致,即课题id为假数据 经客服解决,故无法实现全自动爬取
点击空白处退出提示
语言技术
Python开源地址
https://github.com/pengwow/web-crawler授权协议
LGPL许可
jyeoo 为第一版爬虫基于scrapy + splash
1.账号使用api.jyeoo.com后台接口自动登陆 由于账号被封,此方法废弃,改用手动登陆获取cookie方式
2.vip账号爬取次数过多发生被封号,爬取次数规则未摸清
3.jyeoo后台检测机制使账号发生课题和解析内容不一致,即课题id为假数据 经客服解决,故无法实现全自动爬取
评论