千寻智能引领具身智能发展，开启Scaling Law新篇章

财经聚焦 2025-06-29 15:00:24 来源：上海证券报·中国证券网作者：网络

AI导读：

6月28日，千寻智能负责人解浚源表示具身智能处于GPT1-GPT3阶段，VLA兴起带来Scaling Law可能性。千寻智能采用三段式架构，有望实现技术跨越。

　　6月28日，在青年科学家成果转化暨具身智能高质量发展研修会上，千寻智能具身智能部负责人解浚源表示，具身智能现状可能处在类似于GPT1-GPT3之间的阶段，VLA（视觉-语言-动作模型）的兴起为具身智能开启了“Scaling Law”的可能性。

　　千寻智能创立于2024年2月，成立4个月就完成近2亿元种子轮+天使轮融资。今年3月，千寻智能刚刚宣布一笔5.28亿元人民币Pre-A轮融资，由阿美风险投资旗下Prosperity7 Ventures（P7）领投，招商局创投、广发信德、靖亚资本、东方富海、华控基金、达晨财智、柏睿资本、弘晖基金等参投。

　　在千寻智能两位创始人中，韩峰涛曾任珞石机器人联合创始人CTO，有丰富的机器人制造和量产经验。另一位联合创始人高阳是清华大学交叉信息研究院的助理教授，同时也是千寻智能的首席科学家。

　　解浚源表示，具身智能涵盖“本体”与 “运控”，即 “小脑” 与 “大脑”两大核心领域。在本体层面，机器人早已实现灵巧操作与高动态运动，机械性能长期领先于智能算法，而 “大脑” 层面的技术路径曾长期面临瓶颈。

　　转折点出现在VLA模仿学习路线的兴起。他表示，Diffusion Policy生成模型解决了传统行为克隆的 “多模行为平均化” 难题，可从随机初始状态生成多元可行路径。而VLM（视觉语言模型）与Diffusion Policy的结合（即VLA范式），借助互联网数据预训练赋予模型 “世界先验知识”，仅需少量真机数据即可实现强泛化能力，为具身智能开启了 “Scaling Law”的可能性。

　　大模型训练本质是“用规模换能力”，通过预训练积累通用知识，再通过指令微调与RLHF对齐人类需求，最终依托Scaling Law实现性能突破。

　　解浚源表示，受大模型训练范式启发，千寻智能也是采用了类似的范式，通过“互联网数据预训练+真机数据模仿学习+强化学习优化” 的三段式架构：预训练阶段，利用互联网数据隐含的真实世界知识，让模型具备基础认知。模仿学习阶段，通过真机采集数据做模仿学习，最后用强化学习将成功率从95%提升至99%以上，补足最后精度缺口。

　　解浚源将当前具身智能发展阶段类比为“GPT1-GPT3之间”，他认为若Scaling Law成立，通过量产与基础设施建设，机器人数据量按每年一个数量级递增。例如，今年百台、明年千台、后年万台，3年至5年内具身智能技术效果有望实现GPT1到GPT4级别的跨越。

（文章来源：上海证券报·中国证券网）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。