Video Workflow产品系统Vibe Coding

我要开发同款
达康2026年06月21日
11阅读

技术信息

语言技术
PythonUIPRD前端
系统类型
Windows
行业分类
电商项目任务

作品详情

行业场景

行业:短视频 / 内容创作 / 自媒体工具
目标用户:视频创作者、自媒体运营、内容出海从业者、AI 技术爱好者
解决的问题:
获取抖音视频 → 提取音频 → 转写文字 → 洗稿优化 → 翻译英文 → 生成英文配音
整个流程从一条抖音链接开始,到一段英文配音视频结束
解决内容创作者"不会剪辑/不懂外语/没时间手动处理"的痛点
典型用例:
国内博主将中文视频转为英文版,出海到 TikTok
知识类视频快速提取文案,二次创作
会议/访谈录音转写整理

功能介绍

1、功能模块:
1. 抖音视频下载 解析分享链接,下载 MP4,提取 WAV 音频
2. 语音识别:音频转文字,支持阿里云 ASR 或豆包 ASR(云端)
3. ASR 纠错:DeepSeek 修正错别字和同音字
4. 智能洗稿:DeepSeek 润色文本,三档强度(轻/中/重)
5. 中译英翻译:DeepSeek 将中文翻译为英文
6. 语音合成:Edge-TTS 朗读英文,生成 MP3 配音

2、用户交互流程
粘贴抖音链接 → 解析视频 ID、获取视频信息
勾选处理步骤 → 选择要执行的流水线环节
配置参数 → 选择模型/洗稿强度/配音声线
点击开始运行 → 后台线程执行,UI 实时显示进度
查看输出 → 自动打开输出文件夹,列出生成文件

项目实现

本项目是纯 Python 桌面应用,前后端都是 Python:
1、所有业务逻辑:下载、Whisper、音视频分离、语音识别成文字、DeepSeek/阿里云/豆包 API 调用洗稿文字及文稿翻译、文字的语音合成、文件处理
架构:单机 C/S 混合架构
GUI 界面 本地(PyQt6 桌面窗口)
业务逻辑 本地(Python 进程内执行)
语音识别 云端(阿里云 NLS / 火山引擎 ASR API)或本地(Whisper 离线模型,已排除)
文本润色/翻译 云端(DeepSeek Chat API)
语音合成 云端(微软 Edge-TTS 在线服务)
视频/音频处理 本地(ffmpeg 进程调用)
文件存储 本地 + 阿里云 OSS(临时上传音频)

2、关键技术栈
GUI:PyQt6 + QSS(纯代码布局)
并发:QThread + ThreadPoolExecutor
音视频:ffmpeg(外部进程调用)
云端 ASR:阿里云 NLS REST API / 火山引擎 Seed ASR
文本处理:DeepSeek Chat API / OpenCC
TTS:Microsoft Edge-TTS
文件存储:阿里云 OSS (oss2 SDK)
配置:JSON
打包:PyInstaller + Inno Setup
语言:纯 Python,无其他语言

示例图片

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论