AI导读:

2025全球开发者先锋大会在上海举办,聚焦语料数据建设。库帕思联合首批103家企业、科研机构及专家学者,共同发起成立上海市人工智能行业协会语料工作委员会,中文在线成为首批成员。语料数据的完善对人工智能模型至关重要。

近日,2025全球开发者先锋大会“语料筑基智生时代”主题论坛在上海盛大举办,聚焦人工智能语料数据建设。

活动现场,为推动高质量语料数据发展,库帕思在上海市经济和信息化委的指导下,秉持普惠、链接、创新理念,联合首批103家企业、科研机构及专家学者,共同发起成立上海市人工智能行业协会语料工作委员会,中文在线荣幸成为首批成员。

《上海市推动人工智能大模型创新发展若干措施(2023-2025年)》明确指出,需构建语料数据资源共建共享机制。语料数据的完善对人工智能模型的训练效果及应用场景通用性至关重要。上海市人工智能行业协会语料工作委员会将围绕高质量语料建设,优化语料平台与各垂类应用领域链接,促进语料方、模型方、应用场景方三方合作,共筑高质量、高应用价值的语料生态。

中文在线深耕数字文化领域二十余年,累积了海量高质量数字内容。为满足自研大模型数据需求,公司持续整合文字、音频、图片、视频等多模态优质数据。目前,中文在线已拥有300万册中英文出版物、300万余部原创文学作品、20万+小时有声书及干音、百万级视频数据,以及亿级图片、题库、期刊、行业问答、中外文平行语料等近40种文字和多模态语料资源。

(文章来源:上海证券报·中国证券网)