接需求→
① 识别→
② 分镜素材→
③ 详细脚本→
④ 出视频→
⑤ 合成成片
两张图 → 一条带货视频
上传双图 + 一句需求,AI 自动跑完整 3 段流程。蓝图阶段你可以逐镜改,首帧阶段你可以单张重生。
蓝图 JSON12 镜规划
01
蓝图生成
一次 LLM 调用产出 商品事实 + 人物事实 + 视觉档案 + 12 镜分镜 + 口播文案。生成后你可以逐镜审改。
锚帧串行并行出图
02
分镜首帧
第 1 镜(锚帧)串行先出作视觉锚,其余 11 张并行,带视觉档案 + 锚帧风格确保跨镜一致。单张可重生。
图生视频TTS + 合成
03
视频音频合成
逐 shot 图生视频(1.25 秒/段) + 整片 TTS 口播 + BGM 混音 + ffmpeg 硬切拼接,输出抖音/小红书规格 MP4。
① 蓝图生成
素材
商品图![]()
+
人物图![]()
已选参数
Sales Agent style K1 · ChatGPT 经典
● 生成中14 步因果链 · 镜数由剧本决定
完成后可继续修改蓝图和逐镜脚本
蓝图已就绪
素材
商品图![]()
+
人物图![]()
视频概要
逐镜脚本 · -- 镜
在这里改的所有内容会作为下一步首帧图和视频片段的依据。这是花视频费前最后一道质量门。
🎨 多角度参考素材
商品 / 模特 / 组合三组,作为整片身份与一致性基准。点缩略图放大,点「⟳」单张重生。
--
准备开始
0s
·
预计剩余 --
① 首帧 0 / 0
② 视频 0 / 0
③ 合成
视频已生成
视频已生成
基于本蓝图衍生
换组首帧再做一条
同蓝图重出首帧,A/B 测试视觉
出英文版
改 language=en-US
出极速 3 镜版
换爆款结构,5 秒短钩子
商品图
目标发布平台
画面比例
语种
视频时长15s · 12 镜
Enter 发送 · ⇧+Enter 换行