本项目旨在解决老年人在数字时代面临的智能设备使用困难问题。随着社会老龄化的加剧,越来越多的老年人需要使用智能设备进行日常沟通、获取信息和服务,但传统的人机交互方式(如文字输入、复杂操作)对老年人来说存在较高的学习门槛和使用障碍。
项目针对老年人群体设计了专门的智能语音交互平台,通过语音识别、AI对话和语音合成技术,让老年人能够以最自然的语音方式与智能设备进行交互。系统采用温和亲切的对话风格,避免使用复杂专业术语,特别关注健康、生活、科技使用等老年人关心的话题,提供耐心、尊重的服务体验。同时,项目还设计了故事阅读控制系统,通过文字和音频双模式阅读,帮助老年人享受阅读的乐趣,提升认知能力和生活质量。系统支持完全离线使用,无需网络连接,降低使用门槛,为老年人群体提供了真正友好的数字化解决方案。
语音交互系统
实时语音识别:基于Dolphin ASR模型的高精度语音识别,支持16kHz采样率,识别准确率达95%以上
智能AI对话:集成DeepSeek API的流式对话引擎,支持上下文理解和连续对话,AI助手使用温和亲切的语气,专门为老年人优化
多音色语音合成:支持5种中文音色(晓晓、云溪、云扬、晓伊、云健),使用Edge-TTS实现高质量语音合成
文字交互系统
智能输入控制:支持最多5行文本输入,限制1000字符,实时字符计数
流式输出显示:AI回复以流式方式实时显示,逐字呈现,提供流畅的交互体验
故事阅读控制系统
双模式阅读:支持文字模式和音频模式双模式阅读,两种模式有独立的进度条和状态管理
智能进度跟踪:实时更新阅读进度,支持管理员手动修改完成状态,阅读状态永久保存
QQ音乐风格播放:音频播放界面采用QQ音乐风格设计,简化操作,只保留核心播放/暂停功能
#### 历史记录管理
- **对话历史系统**:自动保存每次对话,支持按时间顺序显示、内容搜索、单条删除和批量删除
- **数据持久化**:使用SharedPreferences本地存储和MySQL数据库双重存储
管理员面板
用户管理:查看所有注册用户信息,显示用户阅读统计和完成率
阅读进度监控:查看所有用户的阅读进度,支持按用户、状态、时间筛选,批量修改阅读状态
前端Android应用开发
UI界面开发:使用Jetpack Compose框架构建所有用户界面,包括主聊天界面、语音通话界面、设置页面、故事阅读界面等。实现了仿微信风格的对话界面。
语音交互功能:实现了完整的语音识别功能,包括AudioRecord录音、WAV格式转换、音频数据上传。优化了按住说话功能,使用detectTapGestures实现完美的按住开始、松开停止录音体验。
AI对话集成:集成了流式AI对话服务,实现了实时流式输出显示,逐字显示AI回复内容。优化了对话体验,确保语音输入和文字输入都使用流式输出,保持一致的交互体验。
语音合成播放:实现了TTS语音合成功能,包括多音色选择、音频播放控制、播放状态管理。优化了播放体验,添加了点击效果提示,提供更好的用户交互反馈。
历史记录管理:实现了完整的对话历史记录系统,包括本地存储(SharedPreferences)和数据库存储,支持搜索、删除、导出功能。
后端服务开发
Flask API服务:开发了完整的Flask后端服务,提供RESTful API接口,包括语音识别接口(/api/transcribe)、语音合成接口(/api/tts)、AI对话接口(/api/chat)、健康检查接口(/health)等。
WebSocket实时通信:实现了WebSocket实时通信功能,支持实时语音通话模式,包括实时音频传输、实时字幕显示。
数据库系统设计:设计了完整的MySQL数据库系统,包括用户表、交互记录表、会话表、阅读进度表、故事交互表等。实现了数据库连接池管理,确保高并发下的稳定性。
服务监控系统:实现了完整的服务监控系统,包括服务状态监控、性能统计、自动恢复机制、健康检查等。优化了数据库连接管理,解决了"Packet sequence number wrong"和"read of closed file"错误。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论