中文数据助力人工智能模型性能跃升

国内财经 2025-08-19 06:25:46 来源：人民日报作者：网络

AI导读：

中文数据在国内大模型训练中发挥重要作用，多数模型中文数据占比超60%，日均Token消耗量1年半增300多倍，反映人工智能应用规模快速增长。

　　本报北京8月18日电（记者王云杉）记者从国家数据局获悉：中文数据在国内大模型的训练性能提升方面发挥着重要作用。国内多数模型训练使用的中文数据占比已经超过60%，有的模型达到80%。中文高质量数据的开发和供给能力持续增强，这有力地推动了我国人工智能模型性能的快速提升，成为人工智能发展的重要支撑。

　　在人工智能时代，Token（通常所说的词元）是处理文本的最小数据单元。国家数据局局长刘烈宏介绍，2024年初，我国日均Token的消耗量为1000亿，截至今年6月底，日均Token消耗量已经突破30万亿，1年半时间增长了300多倍，这一惊人的增长速度反映了我国人工智能应用规模的快速增长，彰显了我国在人工智能领域的强劲发展势头。

（文章来源：人民日报）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。

全球指数

中文数据助力人工智能模型性能跃升

AI导读：

相关文章

腾讯云智能体开发平台模型计费策略调整：涨价背后是AI模型Token消耗量激增

大数据助力中华文化数字化传播

马斯克xAI发布Grok 4.1，引领人工智能模型新潮流

浪潮人工智能模型工厂：引领AI变革，赋能千行百业

小鹏机器人引热议，AI技术助力科技新飞跃

月之暗面发布Kimi K2 Thinking开源模型引领AI技术革新

热门文章

看了这篇文章的还看了

全球指数

中文数据助力人工智能模型性能跃升

AI导读：

相关文章

腾讯云智能体开发平台模型计费策略调整：涨价背后是AI模型Token消耗量激增

大数据助力中华文化数字化传播

马斯克xAI发布Grok 4.1，引领人工智能模型新潮流

浪潮人工智能模型工厂：引领AI变革，赋能千行百业

小鹏机器人引热议，AI技术助力科技新飞跃

月之暗面发布Kimi K2 Thinking开源模型 引领AI技术革新

热门文章

看了这篇文章的还看了

月之暗面发布Kimi K2 Thinking开源模型引领AI技术革新