RAG本地知识库_系统开发案例-程序员客栈

技术信息

语言技术
Python、HTML5、JavaScript系统类型
Web行业分类
人工智能、企业服务

作品详情

行业场景

单位日常运营中积累了大量文档（制度、手册、报告、技术资料等），传统关键词搜索难以理解语义、准确命中相关内容，人工翻阅效率低。大模型虽能对话，但缺乏对私有知识的访问能力，易产生幻觉或偏离事实。本项目旨在构建一套**本地化、可部署**的 RAG 方案，打通「私有文档 → 语义检索 → 大模型生成」链路。

功能介绍

1.功能模块
文档解析支持 docx / pdf / txt / md
文本分块段落分块、固定长度、重叠
向量化 BGE 中文模型（FastEmbed）
向量存储 ChromaDB 本地持久化
语义搜索向量相似度检索
RAG 聊天检索增强 + 大模型问答
Agent 模式工具调用（搜索、时间、计算）
配置管理模型、API、Agent 配置
Web 界面对话、知识库、设置页面
2.主要功能描述
RAG 智能问答：上传文档 → 语义检索 → 生成回答
Agent 与工具：自动选择并执行搜索、时间、计算等工具
多模型支持：Ollama 本地、智谱 GLM、OpenAI 兼容 API
知识库管理：上传、解析、分块、检索一体化
本地部署：数据本地存储，可完全离线使用（Ollama）

项目实现

整个项目从开始到结束由我本人独立自主完成设计、开发工作。
本项目为基于 Python + FastAPI 的本地 RAG 应用，采用 FastEmbed（BGE 中文模型）与 ChromaDB 实现文档向量化与语义检索。支持 docx/pdf/txt/md 上传，按句段分块并保留重叠以维持语义连贯。实现亮点：RAG 与 Agent 双模式可切换，Agent 支持知识库搜索、时间、计算等工具；多模型接入（Ollama、智谱 GLM、OpenAI 兼容）。难点与应对：BGE 检索需为 query 加前缀；Agent 工具调用需兼容 OpenAI 格式；部分网络环境需关闭 SSL 或配置代理。