AI导读:

AI训练数据是推动AI技术落地的核心要素,数据产业正逐步向技术密集型+知识密集型发展。随着大语言模型的崛起,多模态数据需求显著增加,自动驾驶、生成式AI等新兴领域将成为未来增长点。

  央广网北京5月29日消息(记者冯方)人工智能数据是推动AI技术落地的核心要素。作为AI训练数据的“基石”,高质量、多模态的数据资源正成为全球科技竞争的战略性资产,支撑千行百业的智能化转型。

  5月27日,在“科创中国――新质生产力调研行”活动期间,海天瑞声董事会秘书张哲在座谈时表示,数据产业正逐步从劳动密集型向“技术密集型+知识密集型”方向发展。随着以Deepseek为代表的大语言模型的崛起,推理模型对思维链数据(CoT)的需求显著增加,大模型可以通过高质量、高复杂度的多领域思维链数据学习到多样化的解题策略。此外,行业数据的不断汇聚和应用,将推动大模型在各个领域发挥更大的价值。AI发展的下一个浪潮――具身智能,也将更加依赖多模态数据的融合,通过整合视觉、听觉、触觉等多种感知数据,提升智能体对环境的全面理解能力。

  张哲介绍,受益于多模态大模型的快速发展以及“AI+”在应用端的进一步落地,全球训练数据需求快速增长,为AI行业带来了新的增长点。

  展望前路,AI训练数据服务正迎来更多投资新机遇。博时基金指数与量化投资部基金经理李庆阳在调研中指出,AI训练数据需求正从传统场景向新兴领域延伸,自动驾驶、生成式AI、元宇宙、量子计算等将成为未来增长点。尤其是多模态数据融合与自动化标注技术,将推动行业效率革命。总体来说,垂直行业深度应用和技术驱动的消费级创新是AI行业的两大核心发展方向。

  李庆阳进一步分析,AI训练数据市场的定制化服务会朝着垂直化、精细化、智能化这几个方向发展。需求向垂直场景深度渗透,技术驱动效率提升与成本优化,“AI预标注+人机协同”模式可实现数据处理效率的飞跃。

  李庆阳表示:“我们认为,垂直领域数据服务商、多模态技术供应商、自动化标注工具与平台及合规治理平台值得关注。AI数据服务的定制化、精细化趋势不可逆,技术驱动下的效率提升与合规管理是核心壁垒。”

(文章来源:央广财经