DeepSeek开源FlashMLA,助力Hopper GPU高效解码
AI导读:
DeepSeek宣布开源针对Hopper GPU优化的FlashMLA解码内核,专为处理可变长度序列设计,可在H800上实现3000GB/s内存带宽及580TFLOPS计算性能,已投入生产使用。
北京商报讯(记者魏蔚)2月24日,Deepseek宣布开源代码库FlashMLA,专为Hopper GPU优化,打造高效MLA解码内核。据DeepSeek介绍,该内核专为处理可变长度序列而设计,已投入生产使用,用户可在H800上体验到3000GB/s的内存带宽以及580TFLOPS的卓越计算性能,标志着AI计算领域的一大进步。
(文章来源:北京商报,关键词:DeepSeek、FlashMLA、Hopper GPU、AI计算)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

