苏鹏知识库智能问答系统产品系统

我要开发同款
Evan_k2026年06月24日
3阅读

技术信息

语言技术
PythonDockerVueTypeScriptMySQL
系统类型
Web
行业分类
企业服务汽车

作品详情

行业场景

企业内部知识分散在大量 PDF、Word 等文档中,传统关键词检索缺乏语义理解,跨文档问答效率低。采用 RAG 架构将私有文档结构化入库,结合 LLM 实现精准可溯源的知识问答,同时通过 ACL 权限管控保障多用户隔离。

功能介绍

1、实现多格式异步文档入库流水线(PDF / Word / Markdown),扫描件接入 Google Cloud Vision API OCR,OCR 耗时从 Tesseract 的 10–30 s/页降至 0.3–0.8 s/页;
2、向量化阶段通过 asyncio.gather 并发批次提速约 6 倍
3、构建基于 ACL 标签 + 密级的文档权限模型,检索层通过 pgvector && 操作符过滤,保证用户只能召回有权限的内容
4、对接 SiliconFlow 远程 API 实现 Torch-free 生产镜像(去除 ~4 GB PyTorch 依赖),通过 SSE 实现 token 级流式输出,前端实时展示入库各阶段滚动进度

项目实现

1、设计并实现完整 RAG 全链路:文档解析、结构感知分块、向量化、混合检索、精排、流式生成
2、构建多格式异步文档入库流水线,接入 Google Cloud Vision OCR 处理扫描件,asyncio.gather 并发批次向量化
3、设计 ACL 权限模型,在检索层通过 pgvector && 操作符实现物理权限隔离
4、对接 SiliconFlow + DeepSeek API,实现 Torch-free 生产部署与 SSE token 级流式输出

示例图片

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论