阿里巴巴Qwen3-Next架构发布：AI模型架构革新与开源进展

国内财经 2025-09-12 07:00:22 来源：界面新闻作者：网络

AI导读：

9月12日阿里巴巴发布Qwen3-Next基础模型架构并开源80B-A3B系列，通过混合注意力、高稀疏MoE结构等创新提升模型效率，实现AI技术架构重要突破。

　　9月12日，阿里巴巴通义千问正式发布其下一代基础模型架构——Qwen3-Next，同时开源了基于该架构的Qwen3-Next-80B-A3B系列模型，引发科技圈广泛关注。该架构在Qwen3的MoE模型基础上，实现了核心改进：包括引入混合注意力机制提升上下文理解能力，采用高稀疏度MoE结构优化计算效率，通过训练稳定优化技术增强模型鲁棒性，以及创新的多token预测机制显著提升推理速度。此次升级标志着国产大模型在架构设计领域取得重要突破，为AI技术落地应用提供了更高效的解决方案。（关键词植入：AI技术、模型架构、混合注意力、推理效率）

（文章来源：界面新闻）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。