Google发布Gemini Robotics On-Device,具身智能迈入端侧时代
AI导读:
Google DeepMind发布首个可完全在机器人本地部署的视觉-语言-动作模型Gemini Robotics On-Device,标志着具身智能从依赖云端算力迈入本地自主运行的关键转折点,为产业落地打开新可能。
蓝鲸新闻6月25日讯(记者武静静)6月25日,Google DeepMind正式发布首个可完全在机器人本地部署的视觉-语言-动作模型(VLA)——Gemini Robotics On-Device。
这也意味着,具身智能(Embodied AI)正在从依赖云端算力,迈入本地自主运行的关键转折点。Gemini Robotics On-Device能够在算力受限的机器人设备上本地运行,展现出卓越的通用性和任务泛化能力,无需依赖数据网络,对延迟敏感的应用程序具有显著优势。

机器人在无网络连接状态下完成了如“把一个魔方放进包装袋里”“拉开一个包包的拉链”等任务,且只需 50-100 次演示就能学习新技能,而目前大部分机器人需要进行成千上百次训练。该模型能泛化到不同的机器人形态,如双臂机器人和人形机器人。

此外,谷歌首次开放VLA模型的微调功能,还推出了 Gemini Robotics SDK,方便开发者进行模型评估和快速调整。这标志着机器人终于可以走入真实环境,通用模型可以真正运行在硬件终端上,未来不依赖联网也能做复杂操作。
本地VLA模型将使得机器人更适合家庭、医疗、教育等敏感场景,解决数据隐私、实时反应、安全稳定性等核心挑战。不过,在实际落地中挑战依旧不容小觑,机器人硬件的多样性和复杂性依然是突出问题。
(文章来源:蓝鲸新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

