优秀财经网 优秀的人都在用的资讯工具

全球指数

首页 > TAG信息列表 > 线性注意力
  • 阿里千问发布Qwen3.5,推出混合架构模型

    阿里千问发布Qwen3.5,该模型采用创新的混合架构,结合线性注意力和稀疏混合专家技术,实现高效推理,总参数量达3970亿,每次前向传播仅激活170亿参数。...

    2026-02-16