行业知识库智能问答系统产品系统

我要开发同款
yami29962025年10月20日
12阅读

技术信息

语言技术
PythonHTML5CSSJavaScriptReact
系统类型
Web算法模型
行业分类
人工智能机器深度学习

作品详情

行业场景

面向财报/研报等 PDF 的检索增强生成(RAG)系统,支持批量 PDF 解析、向量/混合/三重混合检索、LLM 重排与可视化 UI,提升专业术语与复杂语义问题的检索与回答质量。提供一套基于 Streamlit 的可视化 UI。用户可在浏览器中完成数据导入解析、向量库构建与多策略检索,获得可追溯的问答结果与可视化分析。

功能介绍

项目特色:
1.自适应检索策略:根据本地文档数量自动选择本地检索或 Elasticsearch 检索,支持运行时强制切换。
2.多版本演进:从基础命令行版本延展到多个 WebUI 版本(简洁版、增强版、图像增强版、ES RAG版本等),满足不同部署和交互需求。
3.混合检索与网络补充:优先使用本地知识库,缺失时可通过集成的网络搜索(如 Tavily MCP)补充信息,提高答案覆盖率。
4.多模态支持:集成图像生成工具(MyImageGen)和代码解释器(code_interpreter),支持文本、图像与代码混合交互。
5.UI 与可视化:基于 Gradio 的丰富 Web 界面,支持 LaTeX 渲染、推荐提示、会话管理与主题定制。
6.面向生产的 ES 集成:提供文本搜索、向量搜索(embedding)与高亮显示等功能,适配大规模文档库与高并发场景。

项目实现

我的职责:
1.设计并实现自适应检索配置系统,根据文档数量自动选择最优检索方式。
2.集成通义千问大模型API,实现高质量的自然语言理解和生成能力。
3.开发自定义图像生成工具,扩展系统的多模态能力。
4.优化系统提示词(Prompt),使模型能够根据检索到的上下文生成准确、专业的保险领域回答。
5.基于Gradio框架设计增强版WebUI界面,添加知识库信息展示和数学公式渲染支持。
6.实现命令行交互模式,支持流式输出回答,提升用户体验。
技术栈:
Python、Gradio(Web UI)、Qwen Agent 框架、本地文档检索,Elasticsearch(文本/向量检索、Bulk 索引、text-embedding-v4 、PyPDF2 、文本分块、批量索引与去重策略、定义工具注册(@register_tool)、MyImageGen(图像生成)、tavily-mcp(可选网络搜索 MCP)、code_interpreter(代码解释器)、支持环境变量配置(如 DASHSCOPE_API_KEY、TAVILY_API_KEY),可在单机或带 Elasticsearch 的集群环境中部署

示例图片

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论