本项目面向企业客服和 SaaS 产品支持场景,解决产品文档、套餐政策、退款规则、安全说明、技术问题等知识分散,客服人员查找慢、AI 容易幻觉的问题。系统通过导入企业知识库文档,让用户以自然语言提问,并基于已上传资料生成带引用来源的回答,适合用于智能客服、内部知识助手、售前支持和产品文档问答等场景。
点击空白处退出提示
本项目面向企业客服和 SaaS 产品支持场景,解决产品文档、套餐政策、退款规则、安全说明、技术问题等知识分散,客服人员查找慢、AI 容易幻觉的问题。系统通过导入企业知识库文档,让用户以自然语言提问,并基于已上传资料生成带引用来源的回答,适合用于智能客服、内部知识助手、售前支持和产品文档问答等场景。
项目实现了一个完整的 AI 客服知识库问答系统。管理员可以上传 Markdown 或 TXT 格式的产品文档,也可以一键导入示例知识库;系统会自动解析文档、清洗文本、切分知识片段、生成向量并写入数据库。用户在前端输入问题后,系统会检索最相关的知识片段,再调用大模型生成基于资料的回答。回答结果支持引用来源、来源卡片、相似度展示和 Debug 检索信息,方便验证答案依据。对于知识库中不存在的问题,系统会主动拒答,避免编造内容。同时支持文档列表查看、知识库清空、重复文档去重、健康检查、缺少 API Key 时的友好错误提示,以及 Docker Compose 本地一键部署。
我负责项目从 0 到 1 的全栈实现,包括需求设计、后端 RAG 流程、前端交互界面、数据库结构、Docker 部署和测试脚本。后端使用 FastAPI、SQLAlchemy async、Pydantic 构建接口,PostgreSQL 16 + pgvector 存储文档、分片、向量和问答日志;文档上传后通过 content_hash 去重,并按规则切分为 chunk,再调用 OpenAI Embedding 或本地 hashing embedding 生成向量。问答流程中,系统先对问题生成向量,通过 pgvector 进行 Top-K 相似度检索,再根据阈值过滤无关片段;命中后构造受控 Prompt 调用 DeepSeek 生成答案,并校验引用编号,最终返回答案、引用、来源片段和 Debug 数据。前端使用 React、Vite、TypeScript、Tailwind CSS 实现知识库管理、问题输入、回答展示、来源卡片、相似度条和调试模式。项目通过 Docker Compose 集成前端、后端和数据库,并补充单元测试、构建验证和 smoke test,保证演示稳定性。





评论