项目描述:整合计算机考研知识库(如官方教材,真题等),结合LLM和RAG技术,开发了面向学生的可本地化部署的智
能问答系统,提高LLM索引关键知识的效率和准确性同时减少幻觉,帮助考研学生高效复习。
项目实现:1.离线索引构建:基于 Qwen3-Embedding-8b 模型与多表征技术,完成考研知识数据向量化,搭建层级向量索
引并分布式存储于 ChromaDB 向量数据库。
2.智能检索优化:通过 Ollama 本地部署 Qwen3-8b 实现用户提问的语义理解与结构化转换,采用 Adaptive-RAG 动态调
度 BM25+ 向量混合检索策略,结合 Self-RAG、RRF 算法与 Cohere 模型完成多轮检索结果融合、去重与精细化重排序,
保障检索精准度。
3.专业回答生成:通过 Prompt 模板结合大模型 CoT 推理能力生成结构清晰的专业回答,同时引入引用溯源机制,实现答
案关键信息与检索来源的可追溯验证。
项目成果:在自建的样本集上进行端到端评估,相比没有构建RAG的LLM回答,关键信息回答准确率由64%上升为92%
1.离线索引构建:基于 Qwen3-Embedding-8b 模型与多表征技术,完成考研知识数据向量化,搭建层级向量索
引并分布式存储于 ChromaDB 向量数据库。
2.智能检索优化:通过 Ollama 本地部署 Qwen3-8b 实现用户提问的语义理解与结构化转换,采用 Adaptive-RAG 动态调
度 BM25+ 向量混合检索策略,结合 Self-RAG、RRF 算法与 Cohere 模型完成多轮检索结果融合、去重与精细化重排序,
保障检索精准度。
3.专业回答生成:通过 Prompt 模板结合大模型 CoT 推理能力生成结构清晰的专业回答,同时引入引用溯源机制,实现答
案关键信息与检索来源的可追溯验证。
1.离线索引构建:基于 Qwen3-Embedding-8b 模型与多表征技术,完成考研知识数据向量化,搭建层级向量索
引并分布式存储于 ChromaDB 向量数据库。
2.智能检索优化:通过 Ollama 本地部署 Qwen3-8b 实现用户提问的语义理解与结构化转换,采用 Adaptive-RAG 动态调
度 BM25+ 向量混合检索策略,结合 Self-RAG、RRF 算法与 Cohere 模型完成多轮检索结果融合、去重与精细化重排序,
保障检索精准度。
3.专业回答生成:通过 Prompt 模板结合大模型 CoT 推理能力生成结构清晰的专业回答,同时引入引用溯源机制,实现答
案关键信息与检索来源的可追溯验证。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论