在实际业务和科研中,大量知识以**非结构化文档(PDF / Word)**形式存在,存在几个核心问题:信息分散,难以检索(传统关键词搜索效果差)
知识无法结构化沉淀(缺乏知识图谱)文档理解依赖人工,效率低 AI问答缺乏“可溯源依据”(幻觉严重)
因此立项目标是:构建一个“数字图书管理员式”的系统,实现文档 → 知识 → 可查询 → 可问答 的闭环
点击空白处退出提示
语言技术
Python、Android、HTML5、JavaScript、React系统类型
Web、算法模型行业分类
工业互联网开源地址
https://github.com/Mefiny/-MCP-Knowledge-Graph授权协议
MIT许可
在实际业务和科研中,大量知识以**非结构化文档(PDF / Word)**形式存在,存在几个核心问题:信息分散,难以检索(传统关键词搜索效果差)
知识无法结构化沉淀(缺乏知识图谱)文档理解依赖人工,效率低 AI问答缺乏“可溯源依据”(幻觉严重)
因此立项目标是:构建一个“数字图书管理员式”的系统,实现文档 → 知识 → 可查询 → 可问答 的闭环
智能文档解析 - 支持PDF、Word,自动提取文本和元数据
实体识别NER - 自动识别人物、组织、技术术语等实体
知识图谱构建 - 基于Neo4j的可视化知识网络
语义向量检索 - ChromaDB + Sentence-BERT语义搜索
RAG智能问答 - 结合知识图谱的AI问答系统
交互式可视化 - React + Cytoscape.js图谱展示
负责系统整体架构设计(RAG + 知识图谱融合)
搭建后端服务(FastAPI),设计核心API
实现文档解析与文本处理流程(PDF / Word)
设计并实现向量检索模块(ChromaDB + Sentence-BERT)
构建知识图谱模块(Neo4j + 实体关系建模)
实现RAG问答系统(结合检索结果进行生成)
设计前端交互(React + 图谱可视化)
实现系统“降级机制”
技术栈后端:FastAPI(高性能API)PythonNLP / AIspaCy(NER)sentence-transformers(向量化)OpenAI GPT(RAG生成)
数据层:ChromaDB(向量数据库)Neo4j(图数据库)
前端:React Ant Design Cytoscape.js=




评论