AI导读:

DeepMind推出新模型Genie 2,支持通过单张图片和文字描述生成3D世界,可实时模拟用户互动,有望在游戏领域找到广泛应用。

年初,DeepMind发布了其第一代世界模型Genie,年末之际,该机构再次推出了升级版模型Genie 2。

美国当地时间12月4日,谷歌旗下的人工智能研究机构DeepMind正式推出了新模型Genie 2。作为Genie的升级版,Genie2同样定位为理解和模拟现实世界的生成式AI模型,升级后的它在模拟复杂环境方面能力显著增强。

据DeepMind的论文介绍,新模型的一大亮点在于能够仅凭单张图片和文字描述,生成3D世界。这一过程的持续时间大约为一分钟,但大多数情况下,生成时间会在10到20秒之间。

DeepMind在论文中附带了多段演示视频,展示了用户与Genie 2的互动场景。模型首先根据文字描述生成初始图片,随后基于这张图片,构建出一个完整的3D互动世界。用户可以通过键盘和鼠标与这个世界进行互动,而Genie 2则能够实时模拟并生成用户所看到的每一帧画面。

图片来源:DeepMind

生成的3D世界支持用户从多个视角进行互动,如第一人称视角和等距视角,从而为用户带来真实世界互动的既视感。

图片来源:DeepMind

从演示视频中可以看到,模型生成的3D世界在细节上高度模拟了真实世界,包括物体交互、复杂角色动画、物理现象、照明效果、反射效果以及NPC设计等方面。

图源:DeepMind

尤为重要的是,这款世界模型具备持续学习和成长的能力。论文指出,推出Genie 2的主要目的之一是为通用AI智能体提供无限多样的动态场景,用于训练和评估。通过不断的大规模训练,AI将逐渐从模拟真实世界走向理解真实世界的“智能体”。

凭借上述一系列强大功能,Genie 2模型有望在游戏领域找到广泛的应用空间。

DeepMind团队在论文中特别强调,Genie 2能够根据用户需求生成丰富多样的3D游戏环境。如果未来应用于游戏开发中的任务场景设计,或将为游戏行业带来颠覆性的变革,特别是为《我的世界》等开放世界游戏的创作带来一场技术革命。