FlowDesk AI Customer Knowledge Base_系统开发案例-程序员客栈

技术信息

语言技术
Python、JavaScript、MySQL、Mahout、Spark系统类型
Web行业分类
人工智能

作品详情

行业场景

本项目面向企业客服和 SaaS 产品支持场景，解决产品文档、套餐政策、退款规则、安全说明、技术问题等知识分散，客服人员查找慢、AI 容易幻觉的问题。系统通过导入企业知识库文档，让用户以自然语言提问，并基于已上传资料生成带引用来源的回答，适合用于智能客服、内部知识助手、售前支持和产品文档问答等场景。

功能介绍

项目实现了一个完整的 AI 客服知识库问答系统。管理员可以上传 Markdown 或 TXT 格式的产品文档，也可以一键导入示例知识库；系统会自动解析文档、清洗文本、切分知识片段、生成向量并写入数据库。用户在前端输入问题后，系统会检索最相关的知识片段，再调用大模型生成基于资料的回答。回答结果支持引用来源、来源卡片、相似度展示和 Debug 检索信息，方便验证答案依据。对于知识库中不存在的问题，系统会主动拒答，避免编造内容。同时支持文档列表查看、知识库清空、重复文档去重、健康检查、缺少 API Key 时的友好错误提示，以及 Docker Compose 本地一键部署。

项目实现

我负责项目从 0 到 1 的全栈实现，包括需求设计、后端 RAG 流程、前端交互界面、数据库结构、Docker 部署和测试脚本。后端使用 FastAPI、SQLAlchemy async、Pydantic 构建接口，PostgreSQL 16 + pgvector 存储文档、分片、向量和问答日志；文档上传后通过 content_hash 去重，并按规则切分为 chunk，再调用 OpenAI Embedding 或本地 hashing embedding 生成向量。问答流程中，系统先对问题生成向量，通过 pgvector 进行 Top-K 相似度检索，再根据阈值过滤无关片段；命中后构造受控 Prompt 调用 DeepSeek 生成答案，并校验引用编号，最终返回答案、引用、来源片段和 Debug 数据。前端使用 React、Vite、TypeScript、Tailwind CSS 实现知识库管理、问题输入、回答展示、来源卡片、相似度条和调试模式。项目通过 Docker Compose 集成前端、后端和数据库，并补充单元测试、构建验证和 smoke test，保证演示稳定性。