苏鹏知识库智能问答系统_系统开发案例-程序员客栈

技术信息

语言技术
Python、Docker、Vue、TypeScript、MySQL系统类型
Web行业分类
企业服务、汽车

作品详情

行业场景

企业内部知识分散在大量 PDF、Word 等文档中，传统关键词检索缺乏语义理解，跨文档问答效率低。采用 RAG 架构将私有文档结构化入库，结合 LLM 实现精准可溯源的知识问答，同时通过 ACL 权限管控保障多用户隔离。

功能介绍

1、实现多格式异步文档入库流水线（PDF / Word / Markdown），扫描件接入 Google Cloud Vision API OCR，OCR 耗时从 Tesseract 的 10–30 s/页降至 0.3–0.8 s/页；
2、向量化阶段通过 asyncio.gather 并发批次提速约 6 倍
3、构建基于 ACL 标签 + 密级的文档权限模型，检索层通过 pgvector && 操作符过滤，保证用户只能召回有权限的内容
4、对接 SiliconFlow 远程 API 实现 Torch-free 生产镜像（去除 ~4 GB PyTorch 依赖），通过 SSE 实现 token 级流式输出，前端实时展示入库各阶段滚动进度

项目实现

1、设计并实现完整 RAG 全链路：文档解析、结构感知分块、向量化、混合检索、精排、流式生成
2、构建多格式异步文档入库流水线，接入 Google Cloud Vision OCR 处理扫描件，asyncio.gather 并发批次向量化
3、设计 ACL 权限模型，在检索层通过 pgvector && 操作符实现物理权限隔离
4、对接 SiliconFlow + DeepSeek API，实现 Torch-free 生产部署与 SSE token 级流式输出