企业内部知识分散在大量 PDF、Word 等文档中,传统关键词检索缺乏语义理解,跨文档问答效率低。采用 RAG 架构将私有文档结构化入库,结合 LLM 实现精准可溯源的知识问答,同时通过 ACL 权限管控保障多用户隔离。
点击空白处退出提示
企业内部知识分散在大量 PDF、Word 等文档中,传统关键词检索缺乏语义理解,跨文档问答效率低。采用 RAG 架构将私有文档结构化入库,结合 LLM 实现精准可溯源的知识问答,同时通过 ACL 权限管控保障多用户隔离。
1、实现多格式异步文档入库流水线(PDF / Word / Markdown),扫描件接入 Google Cloud Vision API OCR,OCR 耗时从 Tesseract 的 10–30 s/页降至 0.3–0.8 s/页;
2、向量化阶段通过 asyncio.gather 并发批次提速约 6 倍
3、构建基于 ACL 标签 + 密级的文档权限模型,检索层通过 pgvector && 操作符过滤,保证用户只能召回有权限的内容
4、对接 SiliconFlow 远程 API 实现 Torch-free 生产镜像(去除 ~4 GB PyTorch 依赖),通过 SSE 实现 token 级流式输出,前端实时展示入库各阶段滚动进度
1、设计并实现完整 RAG 全链路:文档解析、结构感知分块、向量化、混合检索、精排、流式生成
2、构建多格式异步文档入库流水线,接入 Google Cloud Vision OCR 处理扫描件,asyncio.gather 并发批次向量化
3、设计 ACL 权限模型,在检索层通过 pgvector && 操作符实现物理权限隔离
4、对接 SiliconFlow + DeepSeek API,实现 Torch-free 生产部署与 SSE token 级流式输出







评论