具身智能新突破:中国引领AI发展浪潮
AI导读:
联汇科技CEO赵天成在2025张江具身智能开发者大会上表示,具身智能真正的‘涌现’是跨任务跨场景的,中国具备显著优势。其团队推出的VLM-R1开源视觉语言大模型在GitHub上获近5000颗星,正探索构建世界模型。中国制造业实力强劲,推动机器人进入良好发展循环。
“具身智能真正的‘涌现’是跨任务跨场景的,最好的本体将萌生于中国。”
5月29日,在2025张江具身智能开发者大会“具身·无界:智能模型的范式创新与架构革命”论坛期间,联汇科技(OmAI)CEO兼首席科学家赵天成在接受澎湃新闻记者采访时作出上述表述。随着具身智能浪潮的兴起,人工智能领域迎来新突破,视觉语言模型(VLM)、视觉语言动作模型(VLA)等应运而生。当前,如何让具身智能像人类一样进行规划与操作,成为学术界与产业界共同面临的挑战。
赵天成毕业于卡耐基梅隆大学计算机系,在视觉语言模型领域有着多年的深入研究,多次担任国际顶会领域主席,是国家重点研发计划(青年科学家)项目负责人。其创办的OmAILab人工智能实验室在今年2月推出了VLM-R1开源视觉语言大模型,采用创新技术,目前在GitHub上已获得近5000颗星。
“当前具身智能模型的发展状态,与2017年、2018年的大语言模型有相似之处,呈现出百花齐放的态势。但方向较为明确,就是构建‘世界模型’。”赵天成表示,各实验室在实现世界模型方面思路各异,“成熟的VLM模型,其理解与生成功能目前仍是分离的。我们正探索如何实现统一结构”。
对于VLM-R1的走红,赵天成称,目的是让模型更好地进行复杂物体理解与视觉推理,目前社区已基于其开放框架衍生出众多新应用。
赵天成认为,智能终端面临的挑战巨大,具身智能需要生态分层的商业模式。中国的制造业实力强劲,有众多企业在从事硬件本体研发。其团队专注做好“大脑”(AI能力)部分,与打造“小脑”(运动控制)的公司合作,推动机器人良好发展。
赵天成强调,中国在具身智能领域具备显著优势,尤其是在供应链、制造业和数据方面。他以小脑系统为例表示,“在中国更有机会萌生出最好的本体”。
赵天成透露,其团队近期将推出机器人大脑平台,旨在通过与硬件厂商合作,使智能硬件成为能结合应用场景的智能体。
据赵天成介绍,机器人大脑涵盖四大板块,能够依据应用场景实现快速定义。
论坛上,赵天成展示了VLM在服务场景中融合多模态感知、长程记忆与自适应决策的完整闭环案例。
赵天成强调,物理终端智能体与普通智能体存在显著差异,就是必须要“快”,要确保响应时效性。
他表示,可通过强化学习或模型结构改进提高响应速度。“对于一些复杂逻辑判断,可能还需一两年时间去进化”。
赵天成预测,具身智能的AGI(通用人工智能)将通过海量学习方式涌现,实现跨任务跨场景的智能。
技术开源打破壁垒,机器人大脑平台提供转化工具,正加速推动具身智能技术迭代。
(文章来源:澎湃新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

