有声读物产品系统Vibe Coding

我要开发同款
proginn11391809682026年06月11日
4阅读

技术信息

语言技术
RedisHTTPVueGo
系统类型
Web
行业分类
人工智能音视频多媒体

作品详情

行业场景

本作品利用大语言模型(LLM)对经典文学作品进行智能改写,结合文本转语音(TTS)技术,实现了从原著到有声书的自动化生产。AI负责故事改编、角色语气控制和节奏优化,在保证内容质量的前提下,大幅降低了有声书制作成本。适用于在线教育、儿童音频内容平台等AI辅助内容生产场景。

功能介绍

本作品是一个AI驱动的有声书自动化生产平台。用户上传电子书后,系统自动完成章节切分、内容改写和语音合成。AI会根据目标受众(如儿童)调整语言风格,将原著改编为口语化、富有表现力的有声文案。技术上实现了文档解析、向量化存储、RAG检索增强生成、多角色TTS合成等完整链路,基于Golang后端开发,支持批量处理和流式输出,可快速将整本电子书转化为系列音频内容。

项目实现

1.Eino 框架:负责 AI Agent 的构建与编排,使用 Graph 工作流管理文档处理、文案生成、音频合成等确定性流程,通过 Agent 的 Tool 机制将各模块封装为可调度的原子能力。
2.大语言模型:接入豆包(Doubao-1.5-pro)等模型,用于原著内容的智能改写与儿童化改编。
3.文本转语音服务:集成 Cosyvoice TTS / Edge-TTS
4.向量数据库:基于 Redis VectorStore 构建知识库,存储文档片段的向量化表示,支持语义检索。
5.PDF 解析:使用 PyMuPDF 等工具完成 PDF 文档的结构化提取与章节切分。

示例图片

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论