AI 语音助手 (MoliEye)产品系统Vibe Coding

我要开发同款
proginn20355252672026年04月28日
7阅读

技术信息

语言技术
PythonReactMySQL
系统类型
Web
行业分类
人工智能

作品详情

行业场景

MoliEye 定位于 "AI 演示讲稿助手" 赛道, 基于眼镜这一载体的特性, 提供AI录音, 同声传译, 灵感记录功能.

功能介绍

AI 录音 (AI Recording): 实时录音转文字,支持多人对话识别和说话人分离。
实时翻译 (Real-Time Translation): 实时双语字幕翻译,录音内容同步翻译并显示分割视图。
灵感捕捉 (Inspiration Capture): 快速捕获语音/文字灵感,自动生成摘要和分类。

项目实现

AI 录音 (AI Recording):
- 基于 WebSocket 全双工音频流管道,前端采集麦克风音频,后端代理转发至语音转录服务,实现带说话人分离的实时转写
- 录音完成后自动触发 LLM 摘要生成
- 集成声纹检索API;支持自定义联系人库、声纹注册、名片 OCR 扫描 (多模态 LLM 视觉识别),建立录音与联系人的多对多关联
实时翻译 (Real-Time Translation):
- 基于 WebSocket 音频流式传输管线,集成同声传译API,支持 s2t 和 s2s 两种模式
- 前端实时展示源语言与目标语言双语字幕片段,带精确时间戳
- 翻译结束后将双语段落合并送入 LLM 生成中文摘要,前端实现自动轮询获取结果
灵感捕捉 (Inspiration Capture):
- 支持语音录音 (MediaRecorder API) 和文字输入双模态
- 录音上传后后端自动调用语音转录服务进行文件转写
- 生成 LLM 摘要,按预定义类别 (日程提醒/代办/项目/知识库/其他) 自动分类
Openclaw Skills 集成:
- 开发 Openclaw Skills,将 AI 录音、实时翻译、灵感捕捉等核心功能暴露为 Agent 可调用的工具,支持通过自然语言指令触发业务流程

示例图片

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论