世界模型:引领AI技术迈向新高度的关键力量
AI导读:
财联社9月29日讯,世界模型对打造下一代人工智能至关重要,或助力创造“通用人工智能”。斯坦福、英伟达等巨头积极布局,中国世界模型领域玩家超10家。世界模型提升AI空间推理,有望接管更多工作,引领AI发展新方向。
财联社9月29日讯 人工智能先驱们几乎一致认为,世界模型对打造下一代人工智能至关重要,尤其在AI发展领域。许多人表示,该技术终将助力创造超越人类的“通用人工智能”(AGI),推动AI技术迈向新高度。
早在去年,斯坦福大学教授、人工智能“教母”李飞飞已筹集2.3亿美元创立世界模型初创公司World Labs。英伟达首席执行官黄仁勋今年早些时候也表示,世界模型能助力实现“物理人工智能”,自主操控机器人、自动驾驶汽车等设备,为AI应用开辟新路径。
而就在上周,Meta官宣发布了一款名为代码世界模型(Code World Model)的LLM,探索如何使用世界模型改进AI代码生成性能。Meta新成立的超级智能AI实验室将与机器人团队合作,构建一个“世界模型”,模拟现实世界物理规律,为机器人提供空间感知和精细操作能力,提升AI在空间推理领域的表现。
在中国方面,全球知名增长咨询公司Frost & Sulllivan近期发布的《2025年中国世界模型发展白皮书》报告显示,中国世界模型领域玩家已经超过10家,展现了该领域的蓬勃发展态势。
不难看到,尽管当前大型语言模型和ChatGPT背后的AI技术备受瞩目,但基于世界模型的人工智能正在前沿研究领域蓄势待发,有望在AI技术革新中承担全新角色,引领AI发展新方向。
这些投入能否如企业界领袖预言般催生“超级智能”尚不明朗。但短期内,世界模型无疑有望提升AI在当前薄弱环节的表现,尤其在空间推理方面,为AI技术注入新活力。
从“书呆子”到“放眼看世界”
当下的AI就好比“书呆子”,它们所知的一切都来自可获取的语言、图像及视频。要更进一步进化,它们必须具备“街头智慧”,而这背后无疑需要“世界模型”大展拳脚,推动AI向更高层次发展。
世界模型是实现空间智能的核心,通过整合多模态数据,为空间智能技术在立体空间中进行推理和操作提供内在的环境表征,其也被认为是物理推理的基础,可以通过模拟未来状态从而更加接近类人智能,弥合人与机器之间的认知对齐差异,促进AI与人类的深度融合。
其中的关键在于,让人工智能像人类和动物那样,从环境中学习并将其抽象版本真实地呈现在“头脑”中。为此,开发者需要通过模拟世界来训练人工智能——这就如同通过玩《GT赛车》来学习驾驶,或通过玩《微软飞行模拟》掌握飞行技巧。此类世界模型涵盖了规划行动、执行操作及预测未来所需的一切要素,包括物理规律与时间维度,为AI训练提供全面支持。
这种世界模型方法,其实已经对现实世界产生了潜在的巨大影响。风险投资公司Lightspeed的合伙人兼投资者Moritz Baier-Lentz表示,无人机战争、新型机器人和比人类更安全的自动驾驶车辆都正从中受益,展现了世界模型在AI应用中的广泛前景。
优步前AI业务负责人、经常批评当前AI模式的Gary Marcus指出,无论当今生成式人工智能接受多少数据训练,它们只能建立世界运作的概率模型。本质上,当前人工智能学习的是输入数据间的关联性——无论是文字图像,还是分子及其功能。这种对世界模糊的近似认知,似乎被混杂地编码在AI“大脑”中,既包含数据本身,又包含大量关于数据处理的庞杂规则——而这些规则又往往残缺不全或自相矛盾,揭示了当前AI技术的局限性。
一个很好的例子是:一台运行1979年程序的雅达利2600游戏机,可以在国际象棋比赛中击败最先进的聊天机器人。这些聊天机器人往往会尝试非法走法,并很快忘记棋子的位置。本质上,当今基于Transformer架构的人工智能是在进行预测,而不是逻辑推理。尽管它们已经通过无数盘游戏和无数规则手册的训练,但仍然如此,凸显了世界模型在提升AI逻辑推理能力方面的重要性。
雅达利2600游戏机之所以能获胜,是因为它使用一个古老而简陋的内部世界模型版本——一个数据库——来保持棋子的位置准确,为AI提供了稳定的参考框架。
连蓝领的岗位也危险了?
现实世界无疑远比受限的游戏世界复杂得多。而为了应对这些挑战,科技巨头们也正在进行新的尝试,利用世界模型推动AI技术的突破。
谷歌DeepMind的研究人员着手打造一个系统,寻求以前所未有的逼真程度实现对现实世界的模拟。最终成果是,Genie 3(目前仍处于研究预览阶段,尚未公开发布)能够仅凭文本提示,生成照片般逼真的开放世界虚拟景观。你可以将Genie 3视为一种快速生成本质上类似开放世界电子游戏的方法——可以尽可能忠实于现实世界。在这个虚拟空间中,新生人工智能“婴儿”可以无休止地玩耍、犯错,并学习如何实现目标,就像现实世界中的幼年动物或人类一样。这个实验过程被称为强化学习,为AI训练提供了新的思路。
DeepMind项目联合负责人Jack Parker-Holder表示,Genie 3是一个系统的一部分,该系统可以帮助训练未来驾驶机器人、自动驾驶汽车和其他“具身化”人工智能的人工智能。他补充称,环境中可能充满了人和障碍物:人工智能可以通过观察人类在虚拟空间中的活动来学习如何与人类互动,提升AI的社交和适应能力。
事实上,特斯拉CEO马斯克可以说是最早抛出“世界模型”这一说法的人士之一。特斯拉为了实现全球范围內所有路况的自动驾驶,在感知跟决策中间,嵌入了一个AI模型,主要是构建一个虚拟环境,以便进行自动驾驶能力的学习和验证,为自动驾驶技术的发展提供了有力支持。
而与之类似,总部位于多伦多的Waabi公司则构建了一个名为“Waabi World”的虚拟世界,专门用于训练人工智能驾驶卡车。让它们在模拟环境中反复碰撞比在现实世界中尝试一次要更为安全也更便宜。该公司首席执行官Raquel Urtasun表示,这可以让人工智能记录数百万英里的虚拟驾驶里程。她补充称,预计到今年年底,Waabi的软件将能够在真实道路上自动驾驶一辆真正的卡车,展现了世界模型在自动驾驶领域的巨大潜力。
目前,大语言模型似乎已经接管了白领工作中的一些职能,而具备世界模型智能的AI可能会接管更多工作——在过往,蓝领工作一直以来相对安全,但随着人工智能开发者对世界模型的深入研究,机器人可能会开始接手卡车司机、水管工或护理员等职位,对就业市场产生深远影响……
(文章来源:财联社)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

