AI导读:

北京时间10月16日,谷歌推出Veo 3.1迎战OpenAI的Sora 2,AI视频模型竞争进入白热化。Veo 3.1在音频生成、电影风格理解等方面有亮点,但性能提升有限,价格吸引力不如Sora 2。行业认为Veo 3.1未超越Sora 2,未来AI视频领域变数大。

  北京时间10月16日,就在Sora 2发布半个月后,谷歌火速推出了最新视频模型Veo 3.1和Veo 3.1 Fast,正面迎战OpenAIAI视频模型竞争进入白热化阶段。

  在官方推文中,谷歌称“Veo正在进行重大升级”,不过,从国内外各方实测来看,从Veo 3到Veo 3.1,确实如名字一样,只是进行了一次小的迭代,在画质、物理上的提升并不算大,在AI音频、自动分镜等方面都不如Sora 2,但Veo 3.1的光影效果更突出,生成速度更快,成为视频生成赛道的重要变量。

  视频生成赛道的竞争越发激烈。今年5月,谷歌发布Veo 3并一度占据文生视频模型榜首,但本月初Sora 2迅速抢走风头。距离上一代模型更新仅5个月后,谷歌推出Veo 3.1,而OpenAI也在同日更新Sora 2,支持普通用户生成15秒视频,专业用户生成25秒视频,两大巨头的竞争态势愈发明显。

  就模型本身来看,谷歌Veo 3.1的核心亮点是更丰富的原生音频生成、更强的电影风格理解与叙事控制,以及更逼真的质感还原。Veo 3.1在多个功能中集成了音频,支持自然对话、音效和环境噪音,在视频画面生成的同时,模型会自动根据画面内容生成环境音、动作声及氛围配乐,尤其在对话上,过去生成科幻短片音频可能像机器人朗读,现在能模拟出紧张的背景配乐与人物语言。

  今年5月,谷歌正式推出Flow,一款由Veo驱动的AI电影制作工具,用户已在Flow中生成超过2.75亿个视频,此次迭代也包括Flow里的多个核心功能升级。业界讨论较多的是首尾帧功能,用户提供视频起始和结束的两张图像,模型即可生成平滑过渡的画面镜头,即使是看起来毫不相关的两张图,AI也能通过想象力将其合理化。

  此外,视频延展功能支持用户从前一剪辑的最后一秒扩展视频,可以生成比原始生成8秒视频更长的片段,持续一分钟或更长时间,这对专业创作者来说十分必要。在素材生视频功能里,用户可以上传多张参考图像,系统自动生成包含指定角色与场景风格的完整视频,还可以通过Remove功能移除画面中的物体或者人物。

  不过,这些功能虽是谷歌首次推出,但在业界并不稀奇,国内众多视频模型早已经有类似首尾帧、素材生视频功能。在模型性能方面,用户测试显示,Veo 3.1在提示词遵循、视听质量与音频支持方面比Veo 3提升约两到三成,基础物理模拟也有进步,但在复杂画面中仍会出现问题,例如生成的体操视频画面中人会多出部分肢体,整体性能较Veo 3提升不大。

  Veo 3.1能否战胜Sora 2?这也是业界评测关注的重点。根据网友测试,两个模型各有优缺点,但Sora 2整体得票数更多。Sora 2在微观写实、光影与物理细节上更常被认可,配音方面也有许多测试显示Sora 2的音频更加自然,另外Sora 2特别之处在于自动分镜,对视频叙事帮助显著,这方面Veo 3.1的镜头变化较为保守,此外对物理世界的理解不如Sora 2。

  在视频长度上,Veo 3.1支持输出最长8秒的视频,Sora 2最新更新后,普通用户可以生成长达15秒的视频。不过,Veo 3.1的优点是生成速度,要比Sora 2快很多,目前Sora 2要等数分钟才能得到结果。此外,谷歌在多模态生态上更为成熟,此前发布的图像模型“Nano Banana”引发广泛关注,谷歌在图像与视频模型的联动可以形成完整的创作闭环。

  Veo 3.1目前处于预览阶段,用户可以在Gemini API、Vertex AI、Gemini应用以及Flow上面付费使用。在接口价格方面,Veo 3.1标准版是0.4美元/秒,快速版是0.15美元/秒,对比Sora2则是0.1美元/秒,Sora2-pro是0.3美元/秒,在价格上的吸引力不如Sora2。

  总结来看,行业认为Veo3.1未到超越Sora2的地步,但这仅是Veo 3到Veo 3.1的一次微调,行业更期待谷歌在下一次大版本更新中扳回一局。回望视频生成赛道,谷歌与OpenAI的拉锯战从未停止,2024年初Sora横空出世引发行业震动,同年5月谷歌推出Veo 1正式迎战,至12月Veo 2在物理模拟与风格一致性上取得突破,当时业界普遍认为Veo 2更优。2025年5月Veo 3发布登顶多榜,然而10月初OpenAI抛出“王炸”Sora 2再度改写竞争格局。两大科技巨头都还在AI视频领域持续加码,国内玩家如可灵、海螺AI、即梦等也都有不小的竞争力,视频生成大战中尚无一家具备绝对统治力,AI视频的“GPT-3.5时刻”仍未到来,未来行业变数仍然很大。

(文章来源:第一财经