阿里通义Qwen3-Max惊艳亮相，性能超越GPT5跻身全球前三

国内财经 2025-09-24 12:25:33 来源：证券时报网作者：网络

AI导读：

9月24日云栖大会，阿里通义旗舰模型Qwen3-Max亮相，性能超越GPT5等，跻身全球前三。其涵盖指令和推理两大版本，预训练数据量达36T tokens，总参数超万亿，具备卓越编程和工具调用能力，推理增强版本更在数学推理测试中获满分。

　　9月24日，2025云栖大会盛大开幕，阿里通义旗舰模型Qwen3-Max惊艳亮相，性能超越GPT5、Claude Opus 4等顶尖模型，成功跻身全球前三行列。Qwen3-Max涵盖指令（Instruct）和推理（Thinking）两大版本，其预览版已在Chatbot Arena排行榜上斩获第三佳绩，正式版性能有望实现更大突破。阿里大模型、Qwen3-Max性能成为行业焦点。

　　Qwen3-Max作为通义千问家族中的佼佼者，是最大且最强的基础模型。该模型预训练数据量高达36T tokens，总参数超过万亿，具备卓越的Coding编程能力和Agent工具调用能力。在SWE-Bench Verified测试中，Instruct版本以69.6分的高分位列全球第一梯队；在Tau2-Bench测试中，Qwen3-Max更是取得突破性的74.8分，超越了Claude Opus4和Deepseek-V3.1等强劲对手。

　　Qwen3-Max的推理增强版本Qwen3-Max-Thinking-Heavy同样表现出色，结合工具调用和并行推理技术，其推理能力达到新高度。尤其在AIME 25和HMMT数学推理测试中，均斩获满分100分，这是国内首次取得的佳绩。Qwen3-Max推理模型之所以能取得如此优异成绩，得益于其懂得调动工具解数学题，能够写代码辅助解题，同时增加计算资源也提升了模型表现。

　　大模型预训练原理Scaling Law（规模化法则）指出，持续增长数据和参数规模是通向AGI的可能路径之一。尽管有部分学者认为预训练的Scaling Law即将逼近上限，但Qwen3-Max的性能突破却显示，继续增大数据和模型参数，仍能锻造出更强的模型。阿里模型发展、通义千问系列展现了强大潜力。目前，通义千问系列模型已实现从0.5B到超万亿的全尺寸覆盖，包含三百多个大模型，可满足不同场景需求。

（文章来源：证券时报网）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。