阿里通义发布Qwen3-Next架构,AI模型优化获突破
9月12日,阿里通义发布Qwen3-Next基础模型架构,采用高稀疏MoE架构和混合注意力机制,实现模型训练与推理的双重性价比突破。新模型Qwen3-Next-80B-A3B性能媲美千问3旗舰版,计算效率大幅提升,训练成本降低超90%。...
9月12日,阿里通义发布Qwen3-Next基础模型架构,采用高稀疏MoE架构和混合注意力机制,实现模型训练与推理的双重性价比突破。新模型Qwen3-Next-80B-A3B性能媲美千问3旗舰版,计算效率大幅提升,训练成本降低超90%。...