具身智能新突破：中国引领AI发展浪潮

财经聚焦 2025-05-31 07:35:44 来源：澎湃新闻作者：网络

AI导读：

联汇科技CEO赵天成在2025张江具身智能开发者大会上表示，具身智能真正的‘涌现’是跨任务跨场景的，中国具备显著优势。其团队推出的VLM-R1开源视觉语言大模型在GitHub上获近5000颗星，正探索构建世界模型。中国制造业实力强劲，推动机器人进入良好发展循环。

　　“具身智能真正的‘涌现’是跨任务跨场景的，最好的本体将萌生于中国。”

　　5月29日，在2025张江具身智能开发者大会“具身·无界：智能模型的范式创新与架构革命”论坛期间，联汇科技（OmAI）CEO兼首席科学家赵天成在接受澎湃新闻记者采访时作出上述表述。随着具身智能浪潮的兴起，人工智能领域迎来新突破，视觉语言模型（VLM）、视觉语言动作模型（VLA）等应运而生。当前，如何让具身智能像人类一样进行规划与操作，成为学术界与产业界共同面临的挑战。

　　赵天成毕业于卡耐基梅隆大学计算机系，在视觉语言模型领域有着多年的深入研究，多次担任国际顶会领域主席，是国家重点研发计划（青年科学家）项目负责人。其创办的OmAILab人工智能实验室在今年2月推出了VLM-R1开源视觉语言大模型，采用创新技术，目前在GitHub上已获得近5000颗星。

　　“当前具身智能模型的发展状态，与2017年、2018年的大语言模型有相似之处，呈现出百花齐放的态势。但方向较为明确，就是构建‘世界模型’。”赵天成表示，各实验室在实现世界模型方面思路各异，“成熟的VLM模型，其理解与生成功能目前仍是分离的。我们正探索如何实现统一结构”。

　　对于VLM-R1的走红，赵天成称，目的是让模型更好地进行复杂物体理解与视觉推理，目前社区已基于其开放框架衍生出众多新应用。

　　赵天成认为，智能终端面临的挑战巨大，具身智能需要生态分层的商业模式。中国的制造业实力强劲，有众多企业在从事硬件本体研发。其团队专注做好“大脑”（AI能力）部分，与打造“小脑”（运动控制）的公司合作，推动机器人良好发展。

　　赵天成强调，中国在具身智能领域具备显著优势，尤其是在供应链、制造业和数据方面。他以小脑系统为例表示，“在中国更有机会萌生出最好的本体”。

　　赵天成透露，其团队近期将推出机器人大脑平台，旨在通过与硬件厂商合作，使智能硬件成为能结合应用场景的智能体。

　　据赵天成介绍，机器人大脑涵盖四大板块，能够依据应用场景实现快速定义。

　　论坛上，赵天成展示了VLM在服务场景中融合多模态感知、长程记忆与自适应决策的完整闭环案例。

　　赵天成强调，物理终端智能体与普通智能体存在显著差异，就是必须要“快”，要确保响应时效性。

　　他表示，可通过强化学习或模型结构改进提高响应速度。“对于一些复杂逻辑判断，可能还需一两年时间去进化”。

　　赵天成预测，具身智能的AGI（通用人工智能）将通过海量学习方式涌现，实现跨任务跨场景的智能。

　　技术开源打破壁垒，机器人大脑平台提供转化工具，正加速推动具身智能技术迭代。

（文章来源：澎湃新闻）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。