一个由 Google Gemini 2.5 Pro、LlamaIndex 和 Next.js 驱动的先进、可投入生产的 企业检索增强生成 (RAG) 系统。该架构引入了一种能够智能地在本地企业知识库和实时互联网研究之间进行路由的自主 ReActAgent。
核心功能
双路由代理工作流程:一个高级的ReActAgent,智能地在本地Qdrant向量数据库(用于内部知识)和Tavily(用于实时网络搜索)之间路由查询。
反幻觉提示:系统级别的提示注入确保LLM严格优先考虑内部文档而不是其预训练的参数化内存,克服“常识傲慢”(例如,检索未发布内部产品的详细信息)。
原生谷歌生态系统:完全利用Gemini API进行推理(模型/gemini-2.5-pro)和密集向量嵌入(模型/gemini-embedding-001),确保768维一致性实时SSE流式传输:通过严格过滤ReAct思维过程(思维:, 操作:)后端侧,仅向前端交付最终解析答案,提供丝滑的打字机效果。
高级UI/UX:响应式Next.js前端,使用TailwindCSS构建,具有玻璃态效果、动态自动滚动、独特的消息气泡和完整的React-Markdown解析。
点击空白处退出提示












评论