诺云直播 App - 智能语音生活管家 产品系统Vibe Coding

我要开发同款
aicoderning2026年05月26日
8阅读

技术信息

语言技术
PythonKafkaNginxFlutterVue
系统类型
Android应用iOS应用Web
行业分类
企业服务

作品详情

行业场景

该项目是 诺云直播 App 的核心 Agent 插件,为用户提供文字与 RTC 实时语音双模态交互。

功能介绍

系统
采用 LangGraph,通过 RAG 架构接入私有知识库,解决大模型在系统操作引导中的幻觉问题;同
时利用 Function Calling 机制打通业务数据库,支持用户通过自然语言完成商品查询、视频导购及
一键下单。项目深度优化了 RTC 语音链路与 RAG 检索性能,确保了极致的交互流畅度。

项目实现

索性能,确保了极致的交互流畅度。
项目职责
1、流程编排与交易闭环: 基于 LangGraph 构建 Agent 协作逻辑,通过条件路由精准识别用
户“咨询、搜索、下单”等意图。利用 Pydantic 严格校验提取的商品参数,并实时调用业务接
口,实现直播间商品卡片弹窗与一键下单的交易闭环。
2、延迟优化: 通过固定 RAG 检索片段排序、合并 System Prompt,深度触发大模型的 Prefix
Caching 与 KV Cache 机制;引入 base-rerank 轻量重排模型,并采用动态平衡 dense_weight 权
重等策略,将复杂 RAG 场景下的首字延迟从 15s 压缩至 3s 以内。
3、意图识别:构建基于 Semantic Router + 本地向量模型 的高效路由体系,通过意图分级管理实
现毫秒级业务分流,显著降低了推理成本与链路延迟;同时建立 Max Token 分级控制模型,通过
分析 95% 覆盖率边界动态配置参数,有效提升了单请求的 Token 利用率。
4、RAG 检索体系: 采用 HNSW_HYBRID 混合检索(向量+关键词)提升商品专有名词的命中率;
应用 Int8 量化技术 降低索引存储空间,在保障召回精度的同时显著提升了检索速度。

示例图片

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论