Mongo

##核心功能设计###1.RSS抓取+正文提取-从配置读取多个公众号RSS源-按时间范围筛选文章(最近N天)-从RSScontent字段提取全文HTML(私有部署RSS服务已经包含全文,不需要二次爬取)-使用BeautifulSoup提取纯净正文文本,去掉HTML标签、广告、推荐阅读等干扰内容-提取
50Python内容平台
当前共1个项目more
×
寻找源码
源码描述
联系方式
提交