DeepSeek技术进展:初步呈现CUDA解耦趋势,国产算力适配加速
华泰证券研究指出,DeepSeek在V3版本中采用PTX优化硬件算法,NSA运用Triton编程语言编写GPU代码,初步显现与CUDA解耦趋势。国产算力已良好适配DeepSeek-R1等模型,华泰证券认为针对国产算力的优化或将持续推进。...
华泰证券研究指出,DeepSeek在V3版本中采用PTX优化硬件算法,NSA运用Triton编程语言编写GPU代码,初步显现与CUDA解耦趋势。国产算力已良好适配DeepSeek-R1等模型,华泰证券认为针对国产算力的优化或将持续推进。...