AI导读:

Meta推出V-JEPA 2开源模型,旨在提升人工智能对3D环境的理解与物理世界的运作规律推理能力。该模型拥有12亿参数,历经超100万小时视频训练,展现出顶尖的视觉理解与预测性能,有望在自动驾驶、送货机器人等领域发挥重要作用。


美东时间周三,Meta推出了V-JEPA 2这一开源模型,旨在提升人工智能对3D环境的理解与物理世界的运作规律推理能力。

Meta强调,V-JEPA 2作为一款世界模型,助力机器人及人工智能主体深入理解物理世界,并精准预测其对行动的反应。

该世界模型系统汲取物理世界逻辑灵感,构建与现实规则相符的内部虚拟环境,推动人工智能以更贴近人类的方式学习、规划与决策。

V-JEPA 2模型参数达12亿,历经超100万小时视频训练,在物理世界中展现出顶尖的视觉理解与预测性能。

例如,V-JEPA 2能识别桌上滚落的球会坠落,或视野外的物体不会消失,展现其强大的推理能力。

Meta认为,V-JEPA 2在自动驾驶汽车、送货机器人等领域具有显著优势,适应复杂多变环境,确保安全作业。

与依赖大量标记数据或视频片段的模型不同,V-JEPA 2通过简化的“潜在空间”推理,理解物体移动、相互作用及响应机制。

Meta指出,V-JEPA 2性能较英伟达的Cosmos模型快30倍,尽管评估基准可能不同。

Meta首席人工智能科学家Yann LeCunn表示,机器理解物理世界与理解语言截然不同。世界模型提供虚拟、简化的现实世界,助力人工智能理解世界、预测行为后果,从而规划行动方案。

LeCunn补充道,世界模型将开启机器人技术新时代,使人工智能助手在无需海量训练数据的情况下,协助人们完成家务与体力劳动。

(文章来源:财联社)