AI导读:

DeepSeek宣布开源针对Hopper GPU优化的FlashMLA解码内核,专为处理可变长度序列设计,可在H800上实现3000GB/s内存带宽及580TFLOPS计算性能,已投入生产使用。

  北京商报讯(记者魏蔚)2月24日,Deepseek宣布开源代码库FlashMLA,专为Hopper GPU优化,打造高效MLA解码内核。据DeepSeek介绍,该内核专为处理可变长度序列而设计,已投入生产使用,用户可在H800上体验到3000GB/s的内存带宽以及580TFLOPS的卓越计算性能,标志着AI计算领域的一大进步。

(文章来源:北京商报,关键词:DeepSeek、FlashMLA、Hopper GPU、AI计算)