AI导读:

9月12日阿里巴巴发布Qwen3-Next基础模型架构并开源80B-A3B系列,通过混合注意力、高稀疏MoE结构等创新提升模型效率,实现AI技术架构重要突破。

  9月12日,阿里巴巴通义千问正式发布其下一代基础模型架构——Qwen3-Next,同时开源了基于该架构的Qwen3-Next-80B-A3B系列模型,引发科技圈广泛关注。该架构在Qwen3的MoE模型基础上,实现了核心改进:包括引入混合注意力机制提升上下文理解能力,采用高稀疏度MoE结构优化计算效率,通过训练稳定优化技术增强模型鲁棒性,以及创新的多token预测机制显著提升推理速度。此次升级标志着国产大模型在架构设计领域取得重要突破,为AI技术落地应用提供了更高效的解决方案。(关键词植入:AI技术、模型架构、混合注意力、推理效率)

(文章来源:界面新闻)