Google Veo 3.1:让 Flow 创作者进入音频时代
Flow 的爆发为 Veo 3.1 铺路
自从 Flow 这个由 Veo 驱动的 AI 制片工具上线 5 个月以来,创作者已经在平台上生成了超过 2.75 亿条视频成果,需求最旺盛的正是更精细的艺术控制和全面的音频支持。1 Veo 3.1 的发布正是对这些反馈的回应。
音频优先的生成体验
Veo 3.1 将 Flow 从“无声分镜器”升级为“声画同步的故事创作工具”。Google 在核心模板中加入生成音频的能力,同时提升提示词贴合度和画面真实感:
- “Ingredients to Video” 支持导入多张参考图,锁定角色、物体与风格,Veo 3.1 会自动匹配情境音效。1
- “Frames to Video” 以起始帧和结束帧拼接出连贯镜头,如今也能输出随剧情变化的声音设计。
- “Extend” 基于上一条视频最后一秒的内容继续生成,可将镜头自然延长到 1 分钟甚至更久,音效同样平滑衔接。
这些模式仍处在实验阶段,Google 表示会根据创作者反馈持续调优音频体验。
内建的编辑粒度
好点子很少一稿过,因此 Flow 也同步引入了基于 Veo 3.1 的编辑能力:
- “Insert” 可在任意画面中添加新元素,阴影、光线都会自动匹配现有场景。
- “Remove” 即将上线,能够无痕移除不需要的角色或物体,并智能补回背景。2
音频栈与编辑工具的结合,使 Flow 更接近一站式的前期制作与分镜工作台。
哪里可以体验 Veo 3.1
除了直接在 Flow 中上手,Google 也把 Veo 3.1 带到 Gemini 平台生态,覆盖从个人到企业的需求:
- Gemini API: 新增 “Ingredients to Video”、“First and Last Frame” 以及 “Scene Extension” 等能力,方便开发者封装进自有应用。2
- Vertex AI: 提供托管算力以部署 Veo 3.1,“Scene Extension” 功能即将面向企业环境开放。2
- Gemini App: 终端用户可直接在 Gemini 应用里调用 Veo 3.1 的视频创作体验。
通过把 Flow 的创作界面与 API、企业级入口打通,Google 正将 Veo 3.1 定位为自家音画合一、提示词理解更强的旗舰视频生成引擎。