DeepMind发布Genie 2世界模型:支持生成3D互动世界
AI导读:
DeepMind推出新模型Genie 2,支持通过单张图片和文字描述生成3D世界,可实时模拟用户互动,有望在游戏领域找到广泛应用。
年初,DeepMind发布了其第一代世界模型Genie,年末之际,该机构再次推出了升级版模型Genie 2。
美国当地时间12月4日,谷歌旗下的人工智能研究机构DeepMind正式推出了新模型Genie 2。作为Genie的升级版,Genie2同样定位为理解和模拟现实世界的生成式AI模型,升级后的它在模拟复杂环境方面能力显著增强。
据DeepMind的论文介绍,新模型的一大亮点在于能够仅凭单张图片和文字描述,生成3D世界。这一过程的持续时间大约为一分钟,但大多数情况下,生成时间会在10到20秒之间。
DeepMind在论文中附带了多段演示视频,展示了用户与Genie 2的互动场景。模型首先根据文字描述生成初始图片,随后基于这张图片,构建出一个完整的3D互动世界。用户可以通过键盘和鼠标与这个世界进行互动,而Genie 2则能够实时模拟并生成用户所看到的每一帧画面。

图片来源:DeepMind
生成的3D世界支持用户从多个视角进行互动,如第一人称视角和等距视角,从而为用户带来真实世界互动的既视感。

图片来源:DeepMind
从演示视频中可以看到,模型生成的3D世界在细节上高度模拟了真实世界,包括物体交互、复杂角色动画、物理现象、照明效果、反射效果以及NPC设计等方面。

图源:DeepMind
尤为重要的是,这款世界模型具备持续学习和成长的能力。论文指出,推出Genie 2的主要目的之一是为通用AI智能体提供无限多样的动态场景,用于训练和评估。通过不断的大规模训练,AI将逐渐从模拟真实世界走向理解真实世界的“智能体”。
凭借上述一系列强大功能,Genie 2模型有望在游戏领域找到广泛的应用空间。
DeepMind团队在论文中特别强调,Genie 2能够根据用户需求生成丰富多样的3D游戏环境。如果未来应用于游戏开发中的任务场景设计,或将为游戏行业带来颠覆性的变革,特别是为《我的世界》等开放世界游戏的创作带来一场技术革命。
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

