Meta发布V-JEPA 2模型,推动AI物理世界理解
AI导读:
Meta推出V-JEPA 2开源模型,旨在提升人工智能对3D环境的理解与物理世界的运作规律推理能力。该模型拥有12亿参数,历经超100万小时视频训练,展现出顶尖的视觉理解与预测性能,有望在自动驾驶、送货机器人等领域发挥重要作用。
美东时间周三,Meta推出了V-JEPA 2这一开源模型,旨在提升人工智能对3D环境的理解与物理世界的运作规律推理能力。
Meta强调,V-JEPA 2作为一款世界模型,助力机器人及人工智能主体深入理解物理世界,并精准预测其对行动的反应。
该世界模型系统汲取物理世界逻辑灵感,构建与现实规则相符的内部虚拟环境,推动人工智能以更贴近人类的方式学习、规划与决策。
V-JEPA 2模型参数达12亿,历经超100万小时视频训练,在物理世界中展现出顶尖的视觉理解与预测性能。
例如,V-JEPA 2能识别桌上滚落的球会坠落,或视野外的物体不会消失,展现其强大的推理能力。
Meta认为,V-JEPA 2在自动驾驶汽车、送货机器人等领域具有显著优势,适应复杂多变环境,确保安全作业。
与依赖大量标记数据或视频片段的模型不同,V-JEPA 2通过简化的“潜在空间”推理,理解物体移动、相互作用及响应机制。
Meta指出,V-JEPA 2性能较英伟达的Cosmos模型快30倍,尽管评估基准可能不同。
Meta首席人工智能科学家Yann LeCunn表示,机器理解物理世界与理解语言截然不同。世界模型提供虚拟、简化的现实世界,助力人工智能理解世界、预测行为后果,从而规划行动方案。
LeCunn补充道,世界模型将开启机器人技术新时代,使人工智能助手在无需海量训练数据的情况下,协助人们完成家务与体力劳动。
(文章来源:财联社)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

