EchoNote 是面向会议、访谈、课堂/灵感记录等场景的“端侧优先”录音整理工具,核心目标是把录音转成可编辑、可检索、可导出的结构化文字,并支持说话人区分和低质量片段的云端补跑。
点击空白处退出提示
EchoNote 是面向会议、访谈、课堂/灵感记录等场景的“端侧优先”录音整理工具,核心目标是把录音转成可编辑、可检索、可导出的结构化文字,并支持说话人区分和低质量片段的云端补跑。
主要功能包括:录音/导入音频、本地 ASR 转写、本地说话人区分、转写片段编辑、说话人重命名、录音文件夹管理、播放定位、AI 摘要/要点/待办/主题整理,以及后续导出能力预留。
开发任务覆盖 Flutter 移动端、ASR 服务、LLM 服务、统一 API 入口、OpenAPI contract、SQLite 数据模型、异步任务队列、对象存储上传、模型下载与版本管理、页面 widget 测试等。
技术栈与架构:客户端使用 Flutter + Riverpod + SQLite + sherpa_onnx,服务端使用 FastAPI + Celery + PostgreSQL + Redis + MinIO,ASR 侧接入 Qwen3-ASR,LLM 侧通过 litellm 做纪要生成。整体采用 monorepo,分为 apps/mobile、services/asr-api、services/llm-api、services/echo-api、packages/contracts。
实现亮点和难点:端侧优先减少隐私风险和上传成本;以 record / segment / speaker label / job 为核心结构,方便编辑、回放、重算和导出;低置信片段支持按片段 fallback,而不是整段上传;难点主要在长音频处理、移动端本地模型体积/性能、说话人聚类与文本时间轴合并、任务中断恢复,以及 sherpa_onnx 这类 FFI 依赖导致 Web 端无法直接构建。



评论