阿里巴巴开源千问3,登顶全球最强开源模型
AI导读:
4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3,性能全面超越全球顶尖模型,登顶全球最强开源模型。腾讯也对混元大模型研发体系进行全面重构。近期,国产大模型发展提速,我国已形成完整的人工智能产业体系。
4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量仅为Deepseek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。这一突破标志着我国在AI领域的重大进展。

千问3作为国内首个“混合推理模型”,集成了“快思考”与“慢思考”,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,显著节省算力消耗。其混合专家(MoE)架构,总参数量235B,激活仅需22B,预训练数据量达36T,性能在推理、指令遵循、工具调用、多语言能力等方面均大幅提升。
在奥数水平的AIME25测评中,千问3斩获81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中,千问3突破70分大关;在评估模型人类偏好对齐的ArenaHard测评中,千问3以95.6分超越OpenAI-o1及DeepSeek-R1。性能提升的同时,部署成本大幅下降,仅需4张H20即可部署千问3满血版。
此外,腾讯对其混元大模型研发体系进行了全面重构,围绕算力、算法和数据三大核心板块,成立大语言模型部和多模态模型部,分别负责前沿技术探索,并加强数据能力和平台底座建设,以应对大模型行业的快速发展。
腾讯表示,此次调整有利于整合资源,优化研发流程,提升AI领域长期技术作战能力。混元大模型技术迭代加速,推出多个新版本模型,并对外开源,GitHub总Star数超过2.9万。
近期,国产大模型发展提速,生成式人工智能正引发产业变革。我国已形成覆盖基础层、框架层、模型层、应用层的完整人工智能产业体系,专利申请量占全球38.58%,位居首位,并培育了400余家国家级专精特新“小巨人”企业。
(文章来源:每日经济新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

