AI导读:

加州大学教授提出机器人数据训练需真实世界数据,引发行业对仿真与真实数据价值的讨论。业界难定孰优孰劣,不同企业选择不同数据路径,真实数据被视为模型训练关键,但高昂采集成本是挑战。

  近期,加州大学伯克利分校副教授Sergey Levine提到,“机器人数据训练,真实世界数据不可或缺”,引发行业讨论。

  这一观点挑战了“以仿真数据替代真机”的做法。在训练成本高昂、数据获取难的背景下,企业该优先依赖仿真数据,还是回归真实环境积累真机数据,成为具身智能公司的关键技术选题。

  PI曾被视为机器人领域的OpenAI。7月28日,在2025年世界人工智能大会现场,第一财经采访了多位机器人企业创始人,试图厘清:在机器人进入真实场景的关键时刻,什么样的数据才真正有价值?

  业界难定孰优孰劣

  “仿真数据很难涵盖所有物理世界中我们希望机器人完成的任务。”智元机器人合伙人姚卯青表示,Sergey Levine的“叉勺理论”与公司在实验中观察到的结论高度一致:部分局部任务可通过仿真训练完成,但大多数复杂任务仍需依赖真实数据。

  “教会机器人使用勺子,可能要上百万次训练。”一位参展工程师举例说。

  人类的智慧来自经验,而AI的智能来自数据。机器人是被海量数据“喂”聪明的。这些数据可能来自真实数据、仿真数据或互联网数据。

  以银河通用为代表的仿真数据优先派,主张自己学得更快、成本更低,甚至能在零真实数据情况下启动。银河通用创始人王鹤曾提到,通过“摇操”采集数据成本高昂,银河通用选择all in “Sim2Real”,即主要依靠合成仿真数据。

  在WAIC展会现场,第一财经记者看到了银河通用的机器人正在充当服务员,进行物品的拿放、递取。

  “有机器人,就有数据;有数据,才有迭代。”擎朗智能CEO李通表示,相比做一两个demo,更关键的是把机器人真正部署到实际岗位上,让它们在真实任务中不断工作、不断犯错,从而积累起对模型训练真正有价值的数据。

  在他看来,服务业的应用场景远比想象中更丰富,从餐饮、酒店、商超、机场、4S店、KTV到行政接待厅,每一个场景虽然任务各异,但底层的“动作元素”是可以被归类的——抓取、递送、避障、交互等基础能力构成了岗位的操作核心。“这些元素对大模型来说是可泛化的,但前提是要有足够丰富的真实数据支撑。”

  李通强调,“机器人必须在一个明确岗位上达到万级部署量,才可能积累出对模型有效的数据。”对于机器人落地岗位的选择,李通认为,真正适合规模化落地的岗位,必须是相对清晰、简单、边界明确的任务,而不是“既要干这个又要干那个”的复合型操作。

  真实和仿真数据孰优孰劣,眼下或许还难以下定论。一位在WAIC现场的企业创始人告诉记者:“现在没人能说死,因为还没有人靠某种数据路径跑出一个通用智能的完全体。”

  鱼和熊掌不可兼得

  在机器人落地过程中,如何处理仿真与真机数据的结合,正成为行业普遍面临的一道技术难题。灵初智能联合创始人陈源培表示,这一问题并非首次出现,早在2023年、2024年公司向投资人汇报时,就明确指出“仿真和真机数据不能简单混合使用”。

  “当模型成长到一定阶段,它会自动识别数据来源,并对不同来源的数据进行不同程度的权重处理。”陈源培解释说,例如,模型会先判断数据来自仿真还是真机,再决定用仿真做策略搜索,还是用真机做微调。这也意味着,数据混合本身存在技术限制,因此灵初的方案是将仿真用于大规模预训练,再通过少量真机数据完成“最后一公里”的打磨。

  北京人形机器人创新中心品牌负责人告诉第一财经,目前公司对机器人进行训练时,仿真数据和真实数据的使用比例为7:3;国家地方共建人形机器人创新中心相关负责人告诉第一财经,公司目前有自建的数据采集中心,真实数据使用比例较高,和仿真数据大概占比为3:1。

  在数据结构层面,业内普遍认为真实数据具有不可替代性,但高昂的采集成本是行业“必须面对的代价”。

  智元机器人首席科学家罗剑岚博士表示,目前是具身智能落地的早期阶段,仿真数据具备成本低、易获得的优势,“但仿真不是替代品,真机数据才是主舞台。目前智元所有的多模态大模型、VLA模型100%使用的都是真机数据。”

  无论选择何种数据进行机器人训练,业内都面临着“鱼和熊掌不可兼得”的困境。

  成立仅一年半,自变量机器人目前正处于产品技术验证(PoC)阶段,与酒店、养老等多个行业客户联合开展项目测试,不断验证其技术在真实、非结构化环境中的高效部署能力。自变量机器人COO 杨倩强调:“我们的核心目标不是快速商业化,而是让机器人在真实场景中真正‘用起来’。”

  她认为,仿真技术目前在机器人“下半身”的训练中仍占据主流,然而,当任务重心从“下半身”的移动转移到“上半身”的精细操作时,依靠仿真能够到达的操作能力就非常有限。她告诉记者,一旦进入长链条、柔性和高度接触的交互任务,仿真所需的工程开销、调参周期和计算成本是巨大的,甚至是不可能完成的。“相比之下,我们更倾向于直接在真实世界进行端到端的数据采集和训练,用较少人力在较短周期内完成训练与部署。”

  “我们从训练到调优,只用了大约一周,就让机器人完成了完整制作任务。”她介绍说。

  杨倩指出:“最终算得过账的,不只是采购成本,而是它在真实场景中能不能真正替代人来做事,甚至长期在人效比上能不能跑赢。”

  当被问及如何看待同行对仿真路径的坚持时,杨倩表示:“与其在仿真世界里反复调参,不如让机器人直接在真实世界里试错成长。”在她看来,“任务定义”才是决定数据价值的核心变量。

  智元机器人同样明确押注真实数据。目前,智元通过自建专业数采工厂,形成全球最大数据集AgiBot World并开源,姚卯青说:“面对具身智能数据的荒漠,我们选择栽下第一棵树,愿其能成为一片森林。”同时,智元还发布行业首个通用具身基座模型——启元大模型,拥有“一脑多形”能力,可适配其他异构机器人本体。

(文章来源:第一财经)