AI 格式转换器产品系统

我要开发同款
卢工2026年06月23日
4阅读

技术信息

语言技术
Android
系统类型
Android应用
行业分类
音视频多媒体

作品详情

行业场景

普通用户处理视频音频图片时,常见需求只有几种 — 转格式、裁前几秒、压分辨率、抽音轨、加水印,但市面上要么是要付费订阅的桌面剪辑软件,要么是把媒体文件上传到云端再下载的网页工具,后者既慢又有隐私顾虑。FFmpeg 命令行虽然万能但参数门槛劝退非技术用户。本作品旨在用对话式 LLM 桥接自然语言意图与 FFmpeg 命令: 用户用一句"裁剪前 10 秒""压成 720p"描述需求,AI 生成可读命令、用户确认或微调后,在手机本地直接执行,文件不出设备。

功能介绍

功能模块: 1) 对话式输入: 选择文件后用自然语言描述意图,如"转成 mp4""裁剪前五秒""压缩到 720p"; 2) AI 生成命令: 后端 LLM 把意图翻译为 FFmpeg 命令并解释每个参数,可读可改; 3) 命令编辑: 用户在执行前可手动调整参数,适合既懂又懒的进阶用户; 4) 本地执行: 命令通过移动端 FFmpeg 库在设备本地跑,媒体文件全程不离开手机,隐私零顾虑; 5) 输出管理: 处理完成后可一键打开输出文件或下载到相册; 6) 历史记录: 每次对话保留 AI 思考过程,常用操作可重复使用; 7) 多媒体类型: 视频转码、音频抽取、图片格式互转、片段截取统一在一个聊天界面内完成。

项目实现

我独立完成产品设计、Android 端开发、Prompt 工程与 FFmpeg 集成。技术栈: Kotlin + Jetpack Compose 写聊天 UI、Coil 处理媒体缩略图、mobile-ffmpeg 跨架构编译版做本地命令执行、Coroutine + Flow 把 ffmpeg 输出流式回显到 UI; LLM 端走 OpenAI 兼容协议,prompt 工程把"用户口语 → 安全的 ffmpeg 命令"约束在白名单参数集合内防止注入危险开关。难点 1: ffmpeg 命令在 Android 沙箱内对 content:// URI 不友好,我做了 ContentUriResolver 把 URI 解析成临时文件; 难点 2: LLM 生成的命令偶尔幻觉非法 codec,我加了一层 Schema 校验失败时让 LLM 自动重试。

下载渠道: Google Play https://play.google.com/store/apps/details?id=com.luming.aiffmpeg

示例图片

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论