“欢乐马”之后“欢乐生蚝”来了!阿里发布世界模型视频产品
AI导读:
阿里AI视频家族“上新”。继AI视频生成工具HappyHorse(欢乐马)后,阿里再推针对视频领域的世界模型产品。4月16日,阿里发布可实时构建和交互的世界模型产品HappyOyster(快乐生蚝)。该模型基于原生多模态架构而建,支持多模
阿里AI视频家族“上新”。继AI视频生成工具HappyHorse(欢乐马)后,阿里再推针对视频领域的世界模型产品。4月16日,阿里发布可实时构建和交互的世界模型产品HappyOyster(快乐生蚝)。该模型基于原生多模态架构而建,支持多模态理解与音视频联合生成,目前可实现漫游(Wander)和导演(Direct)两大核心能力,用户可以实时构建可互动、可演绎、可探索的AI数字世界。同时,用户生成的数字世界,不仅能被完整保存,还能开放给其他用户进行二次创作。据悉,该产品由阿里ATH创新事业部团队研发,与此前爆火的HappyHorse同属一个团队。
已应用于游戏、影视领域
在产品能力上,HappyOyster呈现出差异化优势,支持独家提供实时导演功能,用户可通过自然语言指令随时介入世界演化、调度角色事件,实现从被动探索到主动创作的跨越。在视觉表现上,HappyOyster漫游模式的画面质量更高,风格泛化能力更强。
在漫游模式中,用户仅需一句话或一张图,即可生成具备物理一致性的完整空间,物体位置稳定、场景持久存在,视角与光照也能跟随第一人称视角持续移动;此外,用户能自由切换方向与镜头运动,突破初始画框的边界。
目前Happy Oyster支持长达1分钟的连续实时位移与镜头控制,并支持多样化的风格切换;在导演模式下,用户能够在视频的任意节点,通过文字、语音或图像等多模态输入,随时实现镜头切换、剧情改写、角色调度,在充分的交互中生成一个光照、重力、角色动作与场景因果持续演化的世界,并能选择题材风格。目前,HappyOyster的导演模式支持连续生成 3 分钟以上的480p或720p实时画面。据了解,阿里HappyOyster已在改变游戏、影视创作等传统的内容创作模式和交互体验。
多家企业押注“世界模型”
相比大语言模型相对成熟的模型架构和技术范式,世界模型仍属于前沿探索领域。阿里此次发布的HappyOyster与谷歌的Genie3同属采用同样的建模方式,采用长时间跨度上的世界演化建模型,区别于传统文生视频模型输入提示词、等待渲染、获得成片的被动流程;同时通过学习海量长视频数据,以及文本、动作指令、图像参考等多样控制信号,使得模型能主动理解空间、物理与因果规律,预测情节和画面的演变,从而把“被动生成内容”转变为“主动模拟世界演化”,为构建可交互的通用世界模拟器提供了关键技术路径。
近期针对视频模型,阿里频频发力。4月10日,力压字节Seedance 2.0的匿名视频模型欢乐马被阿里“认领”,该模型将会于4月30日开放API,一出现便被业界频繁讨论。
在行业内,多家视频模型企业也在押注世界模型。今年1月,爱诗科技还推出了全球首个支持1080P的通用实时世界模型PixVerse R1,该模型为全球首个支持最高1080P分辨率通用实时世界模型,已首次将视频生成的延迟从“秒级”降至“即时”响应,实现了“所想即所见、所说即所现”的实时交互体验,标志着AIGC领域的视频生成正式从“静态输出”迈入“实时交互”的全新阶段。
(文章来源:南方都市报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

