优秀财经网 优秀的人都在用的资讯工具

全球指数

首页 > TAG信息列表 > 原生稀疏注意力
  • 月之暗面Kimi发布MoBA技术,与DeepSeek在注意力机制上‘碰撞’

    月之暗面Kimi发布MoBA技术,在长文本处理中大幅降低计算时间和内存消耗。同期,DeepSeek提出原生稀疏注意力机制,两家公司在注意力机制研究上发生‘碰撞’,有助于推动强化学习技术的发展。...

    2025-02-19
  • DeepSeek发布原生稀疏注意力机制NSA技术报告

    DeepSeek在海外社交平台发布关于NSA技术的纯技术论文报告,旨在提高推理速度并降低预训练成本。NSA通过针对现代硬件的优化设计,在多个测试中均能达到或超越全注意力模型的表现,扩展了大语言模型的应用边界。...

    2025-02-18