World Labs推Marble模型,引领空间智能新未来
AI导读:
11月13日,李飞飞创业公司World Labs推出首款产品Marble,由多模态世界模型支持,能创建3D世界。Marble具备持久化、可下载特性,支持多模态输入,提供多档订阅方案。目前,Marble是世界模型赛道首个商用产品,未来将变革多个行业。
11月13日,AI教母、斯坦福大学教授李飞飞的创业公司World Labs正式推出了其首款产品Marble,由多模态世界模型提供支持,官方发文称其是“构建空间智能未来的基础”,该模型能通过单张图片、一段视频或一句文本提示创建高保真、持久的3D世界。这一创新标志着人工智能领域在空间感知能力上的重大突破,为未来智能应用开辟了新路径。

就在两个月前,团队分享了Marble的预览版,目前正式向公众开放的同时,功能也得到了扩展:支持大规模多模态输入、同步推出了一个名为Marble Labs的创意中心,并且开放了免费增值(freemium)与付费订阅服务。在定价方面,Marble 提供四档订阅方案,免费版支持4次生成,仅支持文本和图像输入,标准版每个月20 美元,支持多图、视频输入及高级编辑,最贵的旗舰版达到95 美元/月,包含75 次生成,可以解锁全部功能。
上个月,李飞飞团队还发布了实时模型 RTFM(Real-Time Foundation Model),一张H100就能运行,不过,Marble 的差异化优势在于其生成的是持久化、可下载的 3D 环境,而非在用户探索过程中动态生成世界。公司表示,这一设计显著减少了场景变形与不一致性,并支持将生成世界导出为高斯泼溅(Gaussian splats)、网格(meshes)或视频格式。11 月 10 日,李飞飞还发表了一篇长文为发布造势,引起众多转发,在其中她解释了空间智能为什么是人工智能的下一个前沿。
李飞飞认为,当前以大型语言模型为代表的AI虽然擅长处理抽象知识,却如同在“黑暗中行走”,缺乏对物理世界的真实理解。而空间智能,即人类用以理解、导航并与三维世界交互的底层能力,将是实现机器真正智能的关键突破。李飞飞解释道,人类对世界的理解是整体性的,不仅关乎我们“看见了什么”,还包括事物在空间上的关系、它们的意义以及彼此的关联,而非仅仅依赖语言描述。为了赋予机器这种能力,我们需要构建一种全新的“世界模型”,一类能构建环境内部表征的 AI 系统,这种模型具备生成性、多模态性和交互性三种核心能力。
目前行业内包括谷歌等厂商也都在关注世界模型,但谷歌的Genie 仍处于有限研究预览阶段,竞争对手如 Decart 与 Odyssey 仅推出免费演示版本,Marble是目前世界模型赛道中首个投入商用的产品。从行业的评测来看,Marble整体的交互效果不错,但细节精细程度还需要提升。李飞飞认为,未来几年,具备空间智能的世界模型将变革众多行业。在短期内,空间智能将赋能创造力,为电影、游戏和建筑领域的创作者提供强大工具,如Marble这样的平台能快速生成可探索的3D环境。
中期来看,空间智能将推动具身智能机器人的发展,通过高仿真训练使其成为人类在家庭、实验室中的协作伙伴;长远看,空间智能有望在科学、医疗和教育领域引发革命,通过模拟实验、辅助诊断和沉浸式学习,极大增强人类在各自专业领域的能力。李飞飞在2024年创办了World Labs,短短几月内就完成约 2.3亿美元(约合人民币16亿元)的融资,估值迅速突破 10亿美元(约合70亿元),成为 AI 领域最新的独角兽企业。公司投资方阵容包括 a16z、Radical Ventures、英伟达 NVentures、AMD Ventures 和 Intel Capital 等科技与风投界的重量级玩家。
对于World Labs未来规划,此前团队曾表示第一阶段将专注于构建对三维性、物理性以及空间和时间概念有深入理解的模型,随后将支持增强现实(AR)技术和机器人技术等领域。此前李飞飞提到,团队刚起步,在盈利模式等问题上有很多边界需要突破,相信团队能够解决。(文章来源:第一财经)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

