传统漫剧与动态漫制作周期长、环节多:剧本定稿后要人工拆镜、画分镜、定角色造型,再逐镜头出图与剪辑,小团队与独立创作者难以承担全流程成本。与此同时,大语言模型与多模态生成能力已可支撑「剧本理解—角色一致—镜头语言—视频衔接」的自动化辅助,但缺少面向「漫剧」体裁的一体化工具链,创作者往往要在多个产品间切换,风格与角色难以贯穿全片。本项目面向「从文字到成片」的漫剧创作场景,以可编排的流水线与可替换的多模型后端,降低从剧本到分镜与视频片段的门槛,服务独立作者、MCN 内容试产与教学演示等场景,缩短从创意到可视成片的反馈周期。
(1)项目管理与多语言界面:支持中文等多语言,项目与分集结构化存储。(2)剧本导入与解析:支持 TXT/DOCX/PDF 等上传,结合大模型解析剧情、辅助分集与导入流程可视化。(3)角色体系:从剧本自动提取角色与视觉描述,支持主角/配角与按集关联,并可生成角色多视图参考图以约束后续画面一致性。(4)智能分镜:将剧本拆解为镜头列表,含构图、运镜等可编辑字段。(5)关键帧与参考帧:支持首尾帧模式或参考帧模式,为每镜生成起止关键画面。(6)视频提示词与逐镜视频生成:基于分镜与参考图生成视频提示词,并调用多厂商视频模型生成片段。(7)合成与导出:片段拼接、字幕烧录、最终视频与素材包下载。(8)模型与密钥管理:可配置多家文本/图像/视频供应商,API 密钥服务端持久化;集成火山引擎方舟豆包 Seedream(图片)、Seedance(视频)及即梦 Visual 等能力,便于在合规前提下选用国内可用算力。
本人负责产品需求梳理、前后端一体化实现、多模型接入与生成流水线编排、本地数据与部署方案维护。技术栈:Next.js 16(App Router)、React 19、Tailwind CSS、Zustand、next-intl;数据层 SQLite + Drizzle ORM;AI 侧统一抽象文本/图像/视频 Provider,对接 OpenAI 兼容 SDK、Google Gemini、Kling、火山方舟(Seedream 生图、Seedance 视频任务 API)、即梦(火山 Visual OpenAPI)等;媒体侧使用 FFmpeg 完成拼接与字幕。实现亮点:将「导入—角色—分镜—帧—视频—合成」拆为可单独触发与批量执行的阶段,配合分镜版本与看板视图支持迭代;密钥与模型偏好服务端存储,减轻浏览器泄露风险。难点:多厂商 API 形态差异大(同步/异步、鉴权方式、Base URL 与路径),需在工厂层统一配置并处理轮询、重试与错误可观测性;角色与镜头跨阶段一致性依赖提示词与参考图管线,需在 UI 与任务队列之间保持状态一致。若团队多人,可将「本人」改为「本团队」并列出分工。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论