数据仓库和 BI 报表场景中,表字段含义、指标口径往往散落在 Excel 和口头传递里,新人写 SQL 频繁追问,口径文档更新滞后、检索困难。复杂 SQL 涉及多表关联和分区表命名,理解成本高。
本项目面向数据开发、分析师、报表运维和数据治理人员,适用于运营商、金融、零售等拥有成熟报表体系的企业。典型场景包括:自然语言查询字段含义、粘贴 SQL 获取业务解读、批量导入口径、从 SQL 自动发现待补全字段。
点击空白处退出提示
数据仓库和 BI 报表场景中,表字段含义、指标口径往往散落在 Excel 和口头传递里,新人写 SQL 频繁追问,口径文档更新滞后、检索困难。复杂 SQL 涉及多表关联和分区表命名,理解成本高。
本项目面向数据开发、分析师、报表运维和数据治理人员,适用于运营商、金融、零售等拥有成熟报表体系的企业。典型场景包括:自然语言查询字段含义、粘贴 SQL 获取业务解读、批量导入口径、从 SQL 自动发现待补全字段。
口径管理:支持报表口径(表名/字段/详情)和业务口径(名称/详情)Excel 批量导入,自动切片写入 Chroma 向量库,支持增量同步。
RAG 智能问答:用户自然语言提问,Agent 检索向量库后作答,约束不编造库外内容,对话历史持久化支持多轮追问。
SQL 智能分析:提交 SQL 后,Agent 查口径库解读表关联、过滤逻辑和字段含义,可输出带注释 SQL、字段清单或改写建议,支持连续追问。
人机协同补全:粘贴 SQL 自动解析表和字段,缺失口径写入待办列表,人工填写后回流正式知识库,形成持续沉淀闭环。
Web 界面:Vue 3 单页应用,涵盖 Agent 对话、SQL 助手、口径导入、临时字段管理和 SQL 解析五个模块。
技术栈:FastAPI 异步后端 + MySQL + Chroma 向量库 + SentenceTransformer(MiniLM)+ LangChain Agent+ Vue 3 前端。
架构分层:API 路由 → Service 业务层 → Utils(Agent 引擎、向量工具、LangChain Tools)→ MySQL 存结构化数据,Chroma 存向量索引。
核心流程:Excel 导入 → 写入口径表 → 文本切片向量化 → Chroma 入库;用户提问 → Agent 调 get_embedings 检索 → 生成回答;提交 SQL → Agent 调 get_table_info 查口径 → 输出分析;SQL 解析 → 提取字段 → 人工补全 → 回流知识库。
技术亮点:RAG 与 Agent 工具调用分场景设计;针对数仓分区表名做规范化处理;向量检索本地化部署;异步架构 + 人机协同闭环,知识库随日常使用持续增长。






评论