1. 立项背景和目标
当前酒店行业面临人力成本高、服务标准化不足、客群个性化需求难以满足等痛点,同时现有酒店管理系统(如西软 C7)缺乏开放 API,无法与智能设备、AI 服务高效集成。老登 AI 以 “贾维斯” 为技术原型,旨在打造一款开源免费、可本地部署的酒店场景智能体,通过语音交互、声纹识别、自动化流程等技术,实现酒店运营降本增效、提升宾客体验,同时支持开发者二次定制,适配多门店集中化管理需求。
2. 软件功能、核心功能模块介绍
老登 AI 核心分为三大模块:
智能交互模块:支持粤语 / 普通话语音识别与合成(TTS),通过声纹识别记忆宾客偏好,实现客房控制、服务咨询、会议记录等多场景对话;
系统集成模块:通过反向工程、脚本开发等方式对接西软 C7 等酒店管理系统,实现订单同步、报表自动生成、审批流程触发,打通与钉钉等办公工具的数据流;
硬件联动模块:适配安卓电视棒、自制电路板等硬件,将普通电视改造为 AI 交互终端,同时支持华为 GT3 Pro 等智能设备扩展,实现客房设备自动化控制。
3. 业务流程、功能路径描述
宾客交互流程:宾客入住后通过声纹 / 语音唤醒老登 AI → 系统识别身份并调取历史偏好 → 提供客房服务、餐饮推荐、本地游玩等个性化应答 → 自动同步服务需求至酒店管理系统;
运营管理流程:酒店员工通过 Web 界面配置 AI 规则 → 老登 AI 自动抓取西软 C7 订单数据 → 生成运营报表并推送至钉钉 → 管理员通过界面监控服务状态、优化 AI 应答策略;
功能访问路径:本地部署后通过浏览器 / 客户端登录 → 选择 “宾客交互”/“运营管理”/“硬件配置” 模块 → 按向导完成声纹录入、系统对接、设备绑定等操作。
1. 整体架构和设计思路,不同模块使用的技术栈
老登 AI 采用分层微服务架构,核心分为交互层、集成层、硬件层与数据层,设计思路以 “本地优先、开源可扩展” 为核心:
交互层:基于 Python + FastAPI 构建后端服务,前端使用 Vue3 开发 Web 管理界面;语音识别与合成采用 CoSVoice(粤语 TTS)与 FunASR(多语种 ASR),声纹识别基于 ECAPA-TDNN 模型实现。
集成层:通过 Selenium/Playwright 自动化脚本对接西软 C7 酒店管理系统,使用钉钉开放平台实现消息推送与审批流集成,数据存储采用 SQLite/PostgreSQL 轻量数据库。
硬件层:适配安卓电视棒(Android TV)与自制嵌入式电路板(基于 ESP32),通过 MQTT 协议实现设备联动,支持华为 GT3 Pro 等智能穿戴设备的数据同步。
数据层:采用向量数据库(Chroma)存储宾客偏好与对话历史,支持本地部署与隐私保护。
2. “我” 的负责模块和结果(尽可能量化)
我主要负责系统集成模块与语音交互模块的开发与落地:
系统集成模块:完成西软 C7 订单数据自动抓取脚本,实现每日订单同步效率提升 80%,报表生成时间从 2 小时缩短至 15 分钟;打通钉钉消息推送通道,服务需求响应速度提升 40%,累计完成 3 家酒店的系统对接。
语音交互模块:完成粤语 TTS 模型本地化部署,实现 95% 以上的语音识别准确率,支持 10 + 种酒店场景对话;完成声纹识别功能,宾客身份识别准确率达 92%,累计处理交互请求超 1000 次。
3. “我” 遇到的难点、坑,和解决方案
难点 1:西软 C7 无官方 API,无法直接获取数据。
坑:初期尝试逆向数据库接口,因加密机制复杂导致数据泄露风险。
解决方案:改用浏览器自动化技术(Playwright
1、“我” 负责的具体任务
我独立负责该 AI 助手项目的全流程开发与落地,核心任务包括:
交互层开发:基于 Python+FastAPI 搭建后端服务,使用 Vue3 开发 Web 管理界面,实现声纹录入、AI 规则配置、服务状态监控等功能;集成 CoSVoice 粤语 TTS 与 FunASR 多语言 ASR,结合 ECAPA-TDNN 声纹识别模型,完成语音交互闭环。
集成层对接:通过 Selenium/Playwright 自动化脚本实现西软 C7 酒店管理系统的数据抓取与对接,利用钉钉开放平台完成运营报表推送与审批流程集成;选用 SQLite/PostgreSQL 作为数据存储方案,保障数据轻量化与稳定性。
硬件层适配:完成 Android TV 电视棒与自制 ESP32 嵌入式电路板的适配开发,通过 MQTT 协议实现设备联动,支持华为 GT3 Pro 等智能穿戴设备的数据同步与控制。
客户端开发:基于 PyQt5 开发桌面客户端,实现无边框可拖动窗口、多语言语音合成、聊天历史记录、系统托盘等功能,优化用户交互体验。
项目运维与优化:负责数据库初始化、配置管理、用户权限控制,解决西软 C7 无官方 API 下的自动化数据采集、多语言语音识别在嘈杂环境下的准确率、跨设备 MQTT 通信稳定性等难点问题。
2、项目技术栈、架构及实现亮点与难点
技术栈与架构
技术栈:
后端:Python、FastAPI、Selenium/Playwright、SQLite/PostgreSQL
前端:Vue3
客户端:PyQt5、pyttsx3
语音交互:CoSVoice(粤语 TTS)、FunASR(多语言 ASR)、ECAPA-TDNN(声纹识别)
硬件通信:MQTT 协议、ESP32、Android TV
架构:采用前后端分离 + 三层架构(交互层 / 集成层 / 硬件层),各
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论