AI知识库搭建开源项目

我要开发同款
Tony开发hacker2026年06月02日
7阅读

技术信息

语言技术
PythonDjangoDockerJavaScriptTorch
系统类型
WebLinux
行业分类
人工智能开发工具
开源地址
https://gitee.com/zhang-siyu-Tony/ragflow-main
授权协议
MIT许可

功能介绍

基于深度文档理解的企业级 RAG(检索增强生成)引擎,旨在解决企业在落地 AI 知识库时面临的文档解析难、检索不准、AI 幻觉等痛点。
极致的智能文档解析能力
不仅能提取文本,更能深度理解文档的原始版面结构。
多格式与复杂文档支持:支持 PDF(含扫描件)、Word、Excel、PPT、图片、网页、邮件等 20 多种格式。
深度版面分析:能够精准识别文档中的标题、段落、页眉页脚,并自动将表格转换为 Markdown 格式,保留公式的 LaTeX 格式,甚至能对图片进行 OCR 识别。
可视化切片管理:提供可视化的文本切片(Chunking)策略,用户可以手动调整切片过程,确保关键信息不被割裂,从源头保证 AI 回答的准确性。

示例图片

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论