一 项目背景
BeautyAI 是一款专为美容店老板打造的短视频自动化生产与发布系统。系统整合了语音识别、大语言模型、AI 配音等前沿能力,能够将一段原始拍摄素材自动裁剪为精彩短视频,并同步生成爆款标题、多平台适配文案、双语炫彩字幕和精美封面,实现从素材上传到成片发布的端到端全自动化。
二 解决的问题
项目的核心价值在于解决美业从业者“不会剪视频、不懂写文案、没时间运营”的痛点——老板只需对着镜头讲一段美容知识或真实服务过程,系统即可自动分析精彩片段、匹配情绪化字幕风格、生成多条平台文案并一键发布至抖音等平台,帮助美容店零门槛、低成本地完成短视频内容营销,真正实现“人人都能轻松出片”。
功能介绍
系统提供从素材上传到多平台发布的全链路自动化能力,主要包含六大功能模块: 智能剪辑 ——通过音量分析自动定位精彩片段并裁剪为竖屏短视频; AI 文案生成 ——基于通义千问大模型,根据视频内容自动产出爆款标题、抖音/小红书双平台文案及热门话题标签; 炫彩双语字幕 ——ASR 语音识别后自动翻译英文,并匹配情绪风格(激动、搞笑、温暖等)渲染带发光效果的双语字幕; AI 配音 ——对无人声视频自动调用 TTS 生成配音并混入视频; 封面自动生成 ——提取关键帧叠加标题和情绪色蒙层,一键输出精美封面图; 一键发布 ——对接抖音开放平台 OAuth API,完成视频上传、标题填写与自动发布,小红书发布能力也已在规划中。
一、项目难点(负责全栈开发)
1. 炫彩双语字幕引擎从零实现。 不能用 ffmpeg 内置滤镜,需 Pillow 逐帧绘制、三层光晕 Alpha 合成、CJK/拉丁双模式换行,再 overlay 精确时间定位。 2. 多模块动态编排。 有/无语音两条分支路径加上翻译降级、内嵌字幕旁路,需设计状态机保证单模块失败不中断全链路。
二、项目亮点
1. 全链路无人值守。 上传后 ASR→LLM 文案→剪辑→字幕→封面→发布全自动,美业赛道首创。 2. 自研字幕引擎。 光晕文字+情绪配色+圆角背景,效果媲美剪映。 3. 四层防御性容错。 文案生成 Markdown 剥离→JSON 解析→结构化提取→模板兜底,任何异常不空返回。 4. 平台差异化。 同一视频自动产出抖音口语化和小红书精致风两套文案。
三、技术架构
分层架构 + Docker Compose 编排:前端原生 HTML/JS;FastAPI 异步 API 层;阿里云 DashScope(Paraformer ASR + 通义千问 LLM + CosyVoice TTS);FFmpeg + Pillow 自研渲染管线;VideoPipeline 状态机编排;MinIO + PostgreSQL 存储;抖音 OAuth 2.0 发布;Docker 一键部署三服务。
四、项目收获
1. AI 工程化实践。 理解 AI 应用瓶颈在工程编排不在模型本身。 2. 多媒体底层编程。 掌握 RGBA 像素操作、ffmpeg 滤镜链、CJK 排版与音频信号处理。 3. 防御性编程。 形成多层 fallback、优雅降级、异常隔离的编码习惯。 4. 业务到技术转化。 从"老板想发视频"拆解出六大技术环节并完整落地。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论