网页抓取和智能文档生成系统开源项目

我要开发同款
nansu2026年05月12日
12阅读

技术信息

语言技术
PythonVueNode.js
系统类型
Windows
行业分类
人工智能
开源地址
https://github.com/NansuHzi/web-scraper-docgen
授权协议
MIT许可

功能介绍

文档生成引擎
- 网页抓取 — 支持知乎、微信公众号、CSDN 等主流站点,Playwright 驱动
- 多源搜索 — 融合 Bing、搜狗、360、百度,保证结果多样性
- 多智能体协作 — CrewAI 架构:研究 → 写作 → 审查,自动产出专业文档
- RAG 知识库 — ChromaDB 向量存储,支持检索增强生成
- 多格式导出 — Markdown / 纯文本 / PowerPoint
- 增量抓取 — 基于内容哈希的去重机制

示例图片

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论