AI导读:

  消化了全球2/3的互联网文本语料后,ChatGPT产生质变。如今,训练GPT-5这样领先的语言模型的语料已达100万亿词元,相当于一人以一分钟150个词的语速不间断说话100亿小时。
  我们可以做一个大胆的推论:当物理世界的数

  消化了全球2/3的互联网文本语料后,ChatGPT产生质变。如今,训练GPT-5这样领先的语言模型的语料已达100万亿词元,相当于一人以一分钟150个词的语速不间断说话100亿小时。

  我们可以做一个大胆的推论:当物理世界的数据达到临界点,具身智能也将迎来自己的“GPT时刻”。然而,全球具身智能行业的高质量真实数据仅在50万小时规模。

  今年以来,物理真实数据赛道明显开始加速。鹿明机器人的无本体数采方案将采集效率提升5倍,今年有望达到100万小时规模的具身真机数据产能。觅蜂科技则将今年目标定在千万小时级数据产能,2030年更要实现百亿小时级数据产能。

  一家“卖铲子”的新物种企业

  市场对数据的需求怎么样?如何规避数据隐私风险?数据采集可以众包吗?……在智元合作伙伴大会的一场群访上,问题像潮水一样涌向觅蜂科技董事长兼首席执行官姚卯青——对于这样一家物理数据的“新物种”企业来说,大家对它的技术、前景、商业模式都很陌生。

  摩根士丹利预测2050年全球具身智能市场规模将达5万亿美元,这么大的赛道,此刻却被一个最基础的问题“卡脖子”——数据荒漠。当下大部分团队还在拼命采集数据时,觅蜂科技却致力于将自己打造成一个集自研硬件、数据治理平台、规模化产能网络和质量闭环体系于一体的平台。

  之所以这样布局,是因为物理数据的匮乏主要由3个问题造成,即没数据、数据差和数据不流通,单靠数据采集解决不了问题,需要有人打通其中环节,而串联“全栈”正是有着智元基因的觅蜂的长板。

  平台的定位在商业上也是一招妙棋。姚卯青说:“AI产业链的规律一再证明,卖铲子的人往往最先实现商业化,且最具可持续性。”

  但目前这个市场还太早期了,供给和需求两边都还没成规模。所以,觅蜂同时发起蜂巢数据共创行动,联合上电科、国家数据标委会、工信部赛迪研究院等一起行动,而北京国地、上海国地、灵初、光轮智能等几十家机构是首批参与方。

  从“无本体采集”到“数据代工厂”

  国内真机遥操数据交易均价在每小时500元至1000元水平;而无本体采集数据由于尚未形成规模化产能,早期报价甚至高于真机,达到每小时1000多元。整体高昂的成本极大限制了行业的规模化探索。

  无本体采集的痛点是采集端和部署端的硬件差异太大,中间要做大量算法补偿才能把数据用起来。

  觅蜂采用“同构设计”策略——MEgo系列在硬件布局上与智元机器人的精灵G2 Air保持高度一致。这意味着,人类采集的数据几乎可以无损地迁移到机器人身上。再加上数据治理平台,原本需要大量人工干预的标注、清洗和格式转换工作,如今实现自动化,标注效率提升10倍以上。

  在产能层面,觅蜂采用“自营样板+加盟共创”的轻资产模式。它像“数据代工厂”一样管理产能,输出标准和技术,吸纳加盟伙伴建设采集基地,甚至它还在探索“美团骑手”式的规范化众包模式。按照规划,今年觅蜂将投入约1万台采集终端,实现1000万小时的年数据产能。数字上的突破意味着物理AI的训练数据将从“手工作坊”时代迈入“工业化流水线”时代。

  把握具身智能“核爆点”

  就在觅蜂举办发布会的同一天,它石智航宣布完成超4.5亿美元Pre-A轮融资,创下中国具身智能有史以来最高单轮融资纪录,这笔主要投向两个方向:大脑和人才。

  而在不久前,上海人工智能研究院联合国内头部芯片企业和具身智能厂商发起成立“人形机器人AI软硬件生态融合工作组”,启动“具身智脑”中国方案。

  这些案例都在证明,“机器人大脑”正成为具身智能赛道的核心命题。如果相信参数越多、性能越好的“尺度定律”同样作用于具身智能,那么,就应当相信数据采集与转化是大脑突破的关键。

  姚卯青判断,从数据角度来看,当前具身智能行业仍处在确立技术路径的早期,相当于大模型在变形架构刚提出的2017年至2018年阶段。目前机器人的能力多局限于单一场景的模仿学习,尚未形成具备思维链和长程规划的自主适应能力,距离真正出现类似“ChatGPT时刻”,预计还需4到5年的演进时间。

  如今初步完成“部署态”的智元也公开了下一步目标:未来5年为部署增长期,数据飞轮驱动机器人生产力水平达到人类水平,出货量保持较快增长。2030年后,机器人在制造、物流、服务等领域的生产力或全面超越人类,群体智能开始涌现,释放万亿元级市场潜力。

(文章来源:上观新闻)