AI导读:

DeepSeek近期发布的开源项目引发行业关注,其公布的推理系统理论成本利润率高达545%。训推一体模式符合商业规律,大集群效率提升空间大。DeepSeek的开源风暴预示着公有云将迎来下一个黄金十年,算力建设或将复刻云计算的黄金时代。

3月5日,国盛证券发布研究报告指出,Deepseek近期发布的开源项目,尤其是DeepSeek-V3/R1推理系统优化及成本计算相关内容,引起了行业与市场的高度关注。该系统采用规模跨节点专家并行方案,通过计算和通信重叠,实现了负载均衡,其公布的理论成本利润率高达545%,堪称理论天花板。

值得注意的是,DeepSeek给出的毛利率是在理想状态下计算的理论值,未考虑运维中可能遇到的问题及用户体验,但仍充分证明了推理端大规模集群的高效率。据观察,其24小时输入token数量大于输出token,KVCache命中率高达56.3%,这与长文本上下文对话、问答搜索及问题类型相关,导致输入token多于输出。同时,输入负载预测难度较大,输入量大幅增加时,等待时长会显著增长。

训推一体的模式符合商业规律,大集群效率提升空间巨大。DeepSeek集群兼具推理和训练功能,在有限资金条件下,建设满足多种需求的训推一体集群更具商业合理性。极高的利润率有助于其在硬件折旧期内回本,给予算力投入方持续投资的信心。此外,大集群可7*24小时进行性能和价值压榨,以通用性GPU为主的AI大集群在计算和通信硬件能力上均有大幅提升,相比CPU集群,效率提升空间更大。

DeepSeek的开源风暴预示着公有云将迎来下一个黄金十年。公有云在云计算发展历程中已证明其在效率、经济性和商业价值上的正确性。AI时代将进一步强化公有云的优势,云厂商通过建设更大集群实现规模效应,企业和用户可通过公有云或类似按需订阅服务,便捷地使用最强大的模型。目前,大部分需求集中于文生文token,多模态尚未真正开启scaling law。随着模型能力的不断提升,需求将进一步爆发,算力建设或将复刻云计算的黄金十年。

(文章来源:财中社)