该项目是 诺云直播 App 的核心 Agent 插件,为用户提供文字与 RTC 实时语音双模态交互。
点击空白处退出提示
该项目是 诺云直播 App 的核心 Agent 插件,为用户提供文字与 RTC 实时语音双模态交互。
系统
采用 LangGraph,通过 RAG 架构接入私有知识库,解决大模型在系统操作引导中的幻觉问题;同
时利用 Function Calling 机制打通业务数据库,支持用户通过自然语言完成商品查询、视频导购及
一键下单。项目深度优化了 RTC 语音链路与 RAG 检索性能,确保了极致的交互流畅度。
索性能,确保了极致的交互流畅度。
项目职责
1、流程编排与交易闭环: 基于 LangGraph 构建 Agent 协作逻辑,通过条件路由精准识别用
户“咨询、搜索、下单”等意图。利用 Pydantic 严格校验提取的商品参数,并实时调用业务接
口,实现直播间商品卡片弹窗与一键下单的交易闭环。
2、延迟优化: 通过固定 RAG 检索片段排序、合并 System Prompt,深度触发大模型的 Prefix
Caching 与 KV Cache 机制;引入 base-rerank 轻量重排模型,并采用动态平衡 dense_weight 权
重等策略,将复杂 RAG 场景下的首字延迟从 15s 压缩至 3s 以内。
3、意图识别:构建基于 Semantic Router + 本地向量模型 的高效路由体系,通过意图分级管理实
现毫秒级业务分流,显著降低了推理成本与链路延迟;同时建立 Max Token 分级控制模型,通过
分析 95% 覆盖率边界动态配置参数,有效提升了单请求的 Token 利用率。
4、RAG 检索体系: 采用 HNSW_HYBRID 混合检索(向量+关键词)提升商品专有名词的命中率;
应用 Int8 量化技术 降低索引存储空间,在保障召回精度的同时显著提升了检索速度。



评论