AI导读:

国家发展改革委等四部门联合发布《关于促进数据标注产业高质量发展的实施意见》,强调培育龙头企业、支持科技创新型企业,数据标注行业规模持续增长,上市公司积极布局相关业务,市场前景广阔。

数据标注行业正日益受到市场的密切关注与重视。2024年1月13日,国家发展改革委、国家数据局、财政部以及人力资源社会保障部四部门联合发布了《关于促进数据标注产业高质量发展的实施意见》(下文简称《意见》)。

《意见》明确指出,将积极培育一批在数据标注领域具有引领作用的龙头企业,鼓励这些企业通过资源整合、并购重组等多种方式实现规模化、标准化、集约化发展。同时,对于科技创新型数据标注企业,将给予大力支持和鼓励,以承担基础研究、技术攻关、产业应用等关键任务,从而提升整个产业链的协同创新水平。

所谓“数据标注”,简单来说,就是为文本、语音、图片、视频等多样化的数据添加“标签”。在这个过程中,涉及到了跨领域跨模态语义对齐、4D标注、大模型标注等三项关键技术的突破。这些技术对于提升数据标注的准确性和效率至关重要。

有数据大模型行业的从业者表示,对于所有从事AI数据训练的公司来说,数据标注环节都是不可或缺的。尤其是在算法开发、数据迭代升级等方面,数据标注更是起到了基础性的保障作用。自动驾驶低空经济、智能制造、智慧医疗等领域都离不开数据标注的支持。据行业测算,到2023年,我国的数据标注产业规模已经达到了约800亿元。

《意见》还提出了明确的发展目标,即到2027年,我国的数据标注产业将实现专业化、智能化及科技创新能力的显著提升,产业规模也将大幅跃升,年均复合增长率有望超过20%。

东北证券在1月13日发布的研报中指出,近期国内外算力市场均迎来了利好消息。在海外大厂的引领和国内厂商的推动下,国内以豆包、腾讯、360等为代表的AI应用有望迎来大爆发。因此,建议关注上游数据处理相关的投资机会。

记者通过多方采访了解到,数据标注在人工智能技术研发中扮演着不可或缺的角色,更像是一种“生产要素”。目前,已经有部分A股上市公司开始布局数据标注产品,但主要供各自内部使用。

据统计,截至目前,海天瑞声、格灵深瞳、云天励飞、博彦科技等A股上市公司正围绕市场需求,积极布局数据标注相关产业。其中,海天瑞声在4D数据标注领域取得了显著进展,其DOTS-AD平台能够提供高质量的4D数据标注服务,助力自动驾驶系统理解道路场景的动态变化。而云天励飞则在数据大模型业务板块涉及到数据外采,并有专业的团队从事数据标注等相关业务。

海天瑞声董秘办人士表示,公司的4D数据标注业务已经逐步成熟,并在部分车企落地应用。目前,相关业务收入已占总营收的近两成。而云天励飞董秘办人士则强调,数据标注并非公司的主营业务方向,但确实是训练大型人工智能模型过程中不可或缺的一环。

随着人工智能技术的不断发展,数据标注行业也在朝着更加智能化的方向发展。过去,数据标注需要大量的人力投入,属于劳动密集型产业。但现在,在人机协作的模式下,数据标注的效率得到了显著提升,机器处理数据的能力也越来越强。

作为国内计算机视觉和人工智能技术型公司,格灵深瞳自建了数据标注平台,并通过组建专业团队和采用人工标注加AI模型自动化预识别的方法,为算法提供精准的基础训练数据。公司董秘办人士表示,目前的数据标注工作主要是为内部的多模态大模型算法和研发服务。

有数据大模型行业从业者表示,行业政策的出台将在一定程度上推动数据标注标准的形成,有助于提升数据集的质量和模型算法训练的效率,减少数据再加工环节的工作负担。

在二级市场表现方面,截至1月13日收盘,海天瑞声、格灵深瞳、云天励飞的股价分别上涨了4.44%、1.70%、0.18%,市值分别达到68.50亿元、34.05亿元、153.91亿元。

(文章来源:科创板日报)