优秀财经网 优秀的人都在用的资讯工具

全球指数

首页 > TAG信息列表 > 高稀疏MoE架构
  • 阿里通义发布Qwen3-Next架构,AI模型优化获突破

    9月12日,阿里通义发布Qwen3-Next基础模型架构,采用高稀疏MoE架构和混合注意力机制,实现模型训练与推理的双重性价比突破。新模型Qwen3-Next-80B-A3B性能媲美千问3旗舰版,计算效率大幅提升,训练成本降低超90%。...

    2025-09-12