企业本地知识库问答系统开源项目Vibe Coding

我要开发同款
南安诺2026年04月13日
9阅读

技术信息

语言技术
PythonQT
系统类型
Windows
行业分类
人工智能企业服务
开源地址
https://github.com/NanAnNuo/qa-system.git
授权协议
LGPL许可
演示地址
https://github.com/NanAnNuo/qa-system.git

行业场景

当前企业数字化转型过程中,内部规章制度、业务手册、技术文档等非结构化数据体量激增,传统关键词检索方式存在精准度低、匹配度差的问题,员工文档查询效率极低;同时多数企业对内部核心数据有严格保密要求,云端大模型问答服务存在严重的数据泄露风险,而市面现有本地化 RAG 方案部署门槛高、运维成本高,普通中小企业及部门难以落地使用。本项目立项旨在解决上述行业痛点,打造一款低门槛、高安全、可离线部署的本地知识库问答工具,降低企业大模型应用落地门槛,提升内部文档查询与知识流转效率

功能介绍

本项目包含四大核心功能模块,各模块功能如下:1.RAG 核心检索与生成模块,支持 Markdown 格式文档的批量导入、自动解析,完成文本智能切分、语义向量化处理,基于 FAISS 构建本地向量索引,实现精准语义召回与大模型增强生成,输出贴合文档内容的精准答案;2. 桌面端 GUI 交互模块,基于 PyQt5 开发可视化桌面界面,支持用户便捷完成文档管理、提问交互、会话切换等全流程操作,界面简洁易上手,无技术背景用户也可快速使用;3. 会话历史管理模块,基于 JSON 实现会话数据的本地持久化存储,支持历史会话的查看、回溯、删除与管理,完整保留用户的问答上下文;4. 多模态语音交互模块,自研 speech_manager 模块,集成高精度 STT 语音转文本与 TTS 文本转语音能力,支持用户语音发起提问、答案自动语音播报,实现全双工实时语音交互,适配无键盘操作、视障辅助等多元场景。

项目实现

本项目为本人独立全栈开发完成,全程负责项目需求调研、架构设计、代码开发、测试优化全流程工作,完成所有功能模块的设计与落地。项目采用模块化低耦合的整体架构,以 Python 为核心开发语言,基于 LangChain 框架搭建完整的 RAG 检索增强生成链路,向量模型选用 BAAI/bge-large-zh 中文大模型,搭配 FAISS 本地向量数据库实现高效语义检索,基于 PyQt5 开发桌面端 GUI 界面,自研封装模块实现多模态语音交互能力。项目核心亮点在于实现了完全本地化离线部署,核心数据全程留存本地,彻底杜绝数据泄露风险,同时通过异步线程优化实现界面零卡顿运行,多模态交互能力大幅拓宽了产品应用场景。开发过程中核心难点为大模型网络请求阻塞 UI 主线程导致界面卡顿崩溃,以及长文档语义召回率不足的问题;针对界面卡顿问题,引入 QThread 异步工作线程机制,将大模型请求、文档处理等所有耗时操作剥离至子线程执行,主线程仅负责 UI 渲染,通过信号槽机制完成线程间通信,彻底解决卡顿问题,将界面响应延迟控制在 100ms 以内;针对语义召回率低的问题,采用 RecursiveCharacterTextSplitter 优化文本切分策略,设置适配中文文档的 chunk 大小与重叠率,搭配中文优化的 BGE 向量模型。

示例图片

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论