阿里巴巴开源新一代通义千问模型Qwen3，登顶全球开源模型

商业视界 2025-04-29 10:34:13 来源：证券时报作者：网络

AI导读：

4月29日，阿里巴巴开源新一代通义千问模型Qwen3，在多个权威基准测试中全面超越顶尖模型，登顶全球开源模型。Qwen3具备混合推理模式、提供多种参数大小的模型版本、推理能力显著提升、支持MCP协议且部署成本大幅下降。

4月29日，阿里巴巴开源了备受瞩目的新一代通义千问模型Qwen3（简称千问3），在GPQA、AIME24/25、LiveCodeBench等多个权威基准测试中全面超越R1、OpenAI-o1等顶尖模型，登顶全球开源模型，展现AI技术新突破。

其中，在奥数水平的AIME25测评中，千问3以81.5分刷新开源纪录；在考察代码能力的Live Code Bench测评中，千问3突破70分大关，表现优于Grok3；在评估模型人类偏好对齐的Arena Hard测评中，千问3以95.6分超越OpenAI-o1及Deepseek-R1。

千问3采用混合专家架构，总参数量为235B，激活参数量仅需22B，在推理、指令遵循、工具调用、多语言能力等方面均大幅增强。

千问3具有以下主要亮点：

一是“快思考”与“慢思考”结合。作为国内首个“混合推理模型”，Qwen3将“快思考”与“慢思考”集成进同一个模型，能够在复杂的逻辑推理、数学和编码等任务与简单实时交互之间无缝切换，既快速响应简单需求，也能深度思考复杂问题，节省算力。

二是提供8种参数大小的模型。千问3提供丰富的模型版本，包括2款30B、235B的混合专家模型，以及6款稠密模型，每款均获同尺寸开源模型最佳性能。这为不同场景与任务提供了合适的尺寸模型，平衡性能与成本。

三是推理能力显著提升。千问3在数学、代码生成和常识逻辑推理方面超越QwQ和Qwen2.5 instruct models。其中，Qwen3-235B-A22B表现尤为突出，刷新开源模型智能水平新高，显存占用仅为相近模型的三分之一。

四是支持MCP协议，具备强大的工具调用能力。千问3在评估模型智能体能力的BFCL评测中拿下新高，超越谷歌Gemini2.5-Pro等顶尖模型，降低智能体调用工具门槛。

五是部署成本大幅下降。千问3旗舰模型部署成本仅为满血版R1的25%—35%，大降75%—65%。

千问3系列模型采用Apache2.0协议开源，支持119多种语言，已上线多个平台，全球开发者、研究机构和企业可免费下载并商用。个人用户可通过通义APP体验千问3，夸克也将全线接入。

AI产业关注点转向以智能体为核心的AI应用，千问3的发布和开源将推动大型基础模型研发，助力全球研究人员、开发者和组织构建创新解决方案。

千问3以更小的参数规模实现更高智能水平，为开发者提供更多样化的模型尺寸及思考模式选择，有助于平衡及控制预算成本。

通义千问团队技术负责人表示，团队正迈向训练智能体扩展长程推理的新阶段，同时关注现实世界的任务。

阿里已开源200余个模型，全球下载量超3亿次，千问衍生模型数超10万个，成为全球第一开源模型，增强了中国在全球开源AI生态中的影响力。

（文章来源：证券时报）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。