私有知识库 AI 问答系统（支持半联网 / 完全离线双模式）

技术信息

语言技术
Python、Flask、JavaScript系统类型
Web行业分类
人工智能、企业服务

作品详情

行业场景

本系统主要面向对数据安全有严格要求、希望利用私有知识库提升咨询效率的机构，包括但不限于：
- 律师事务所、企业内部法务部门
- 合规咨询机构、政策研究机构
- 社区调解中心、基层法律服务站点
- 需要私有化部署AI知识库的企业IT部门
解决的核心痛点：通用AI工具无法基于机构内部专有文档回答、数据上云存在泄密风险、人工咨询响应慢且成本高。

功能介绍

这是一个完全可控、可私有化部署、数据不出内网的智能知识库问答系统。主要功能包括：

1. 私有知识库构建
支持上传机构内部的合同、法规、卷宗、制度文件等（.txt / .docx），系统自动建立向量知识库，AI仅基于这些文档回答问题，不使用外部互联网数据。

2. 专业级问答范式
采用定制化Prompt工程，强制AI输出结构化回答，包含：结论、法条/原文依据、置信度、分析及行动建议，答案可审计、可溯源。

3. 灵活部署模式

当前版本：知识检索完全本地 + 云端大模型生成（效果好，开箱即用）

可升级版本：支持替换为本地大模型（Ollama + Qwen），实现完全离线、零数据外泄

4. 可视化交互界面
提供Web端对话界面，全屏自适应，支持一键启动、日志审计、可演示可交付。

5. 技术栈
Python + LangChain + Chroma + 本地Embedding + Flask + 自适应HTML/CSS，支持Docker封装。

项目实现

一、整体技术架构

本项目采用 RAG（检索增强生成）架构，实现「私有文档 → 向量化 → 语义检索 → 大模型生成」的完整闭环。

模块技术选型说明
后端框架 Python + Flask 提供 API 服务与 Web 界面
文档加载 LangChain + python-docx 支持 .txt / .docx 递归加载
文本切块 RecursiveCharacterTextSplitter chunk_size=800, overlap=100
向量化 SentenceTransformer（本地） paraphrase-multilingual-MiniLM-L12-v2
向量数据库 Chroma 持久化存储，支持相似度检索
大模型阿里云百炼 API / 可替换 Ollama 支持半联网与完全离线双模式
前端界面原生 HTML/CSS/JS + Flask 模板全屏自适应，聊天区域可滚动，输入框固定底部
部署方式一键启动 / Docker 可封装适配企业私有化场景
二、核心实现逻辑

知识库构建：递归遍历 knowledge/ 目录，自动加载所有 .txt / .docx 文档，切块后通过本地 Embedding 模型向量化，存入 Chroma 向量数据库。

检索增强生成：用户提问后，系统将问题向量化并与库中向量进行相似度检索（Top-K = 6），召回相关文本块作为上下文，连同 Prompt 模板一并提交给大模型生成答案。

专业 Prompt 工程：针对法律/合规场景设计了强制输出格式，要求大模型按「结论｜依据｜置信度｜分析｜建议｜免责声明」结构化回答，确保答案可审计、可溯源。

灵活部署能力：当前版本调用云端大模型 API（效果好、无需 GPU）。同时预留了完全离线方案（Ollama + Qwen 本地模型），可满足更高数据安全要求的客户。