面向建筑设计企业内部知识管理场景,针对宣传册、作品集等设计资料分散、检索效率低的问题,构建集 OCR 文档处理、知识库管理、智能检索与企业微信问答于一体的智能知识服务平台。
点击空白处退出提示
面向建筑设计企业内部知识管理场景,针对宣传册、作品集等设计资料分散、检索效率低的问题,构建集 OCR 文档处理、知识库管理、智能检索与企业微信问答于一体的智能知识服务平台。
企业宣传册 PDF 批量解析
OCR 文本识别与结构化处理
企业知识库构建
AI 智能问答与文档检索
团队信息查询与业务工具调用
企业微信机器人接入
多轮对话记忆与流式响应
独立完成宣传册 PDF 批量处理流程开发,使用 PaddleOCR 对 700+ 企业宣传册进行文本抽取与解析。
调用大模型对非结构化作品集内容进行信息抽取,生成标准化 JSON 数据并写入 MongoDB,构建企业知识库。
设计 MongoDB 文档模型与数据清洗流程,为后续 RAG 检索提供结构化数据支撑。
基于 LangChain 与 LangGraph 实现 Agent 服务,将团队信息、设计文档、用户登录态等业务能力封装为 Tool 供大模型调用。
使用 FastAPI + SSE 实现流式对话输出与多轮会话管理,提升交互体验。
基于 JWT + Redis 实现用户鉴权与会话状态管理。
对接企业微信应用与机器人消息链路,实现智能问答入口及业务通知能力。
使用 Docker 完成 OCR 服务、知识库服务及 AI 服务容器化部署,并通过 Nginx 实现统一访问入口。
参与 Linux 服务器运维、WireGuard 组网及网络安全配置,保障系统稳定运行。
针对 PaddleOCR 推理过程进行参数优化,降低 GPU 显存占用并提升批量处理稳定性。



评论