AI导读:

DeepSeek开源周收官,公布V3/R1推理系统关键信息,理论成本利润率高达545%。通过大规模跨节点专家并行等技术优化推理系统,推出错峰优惠活动吸引用户。DeepSeek持续创新,未来可期。

  Deepseek开源周收官,DeepSeek以最后一弹,再次在AI领域激起了广泛关注。

  3月1日,DeepSeek在知乎上发表题为《DeepSeek-V3/R1 推理系统概览》的文章,全面揭晓V3/R1 推理系统的核心机密。这一举动在AI界引发了热烈讨论。

  尤为引人注目的是,文章首次公布了DeepSeek的理论成本和利润率等关键数据。假定GPU租赁成本为2美元/小时,DeepSeek的总成本为87072美元/天,而理论上一天的总收入可达562027美元/天,成本利润率高达545%。这一数字彰显了DeepSeek在AI推理服务上的盈利能力。

  DeepSeek推理系统优化显著,成本利润率惊人

  据文章介绍,DeepSeek-V3/R1推理系统的目标是实现更大的吞吐和更低的延迟。为此,DeepSeek采用了大规模跨节点专家并行(Expert Parallelism / EP)方法,并通过一系列技术策略,最大程度地优化了大模型推理系统。

  在吞吐方面,大规模跨节点专家并行能够大幅增加batch size,从而提高GPU矩阵乘法的效率。而在延迟方面,该方法使得专家分散在不同的GPU上,降低了访存需求,从而减少了延迟。

  然而,大规模跨节点专家并行也带来了系统复杂性的增加,如跨节点通信、多节点数据并行、负载均衡等挑战。DeepSeek在文章中详细阐述了如何应对这些挑战,通过规模化跨节点专家并行、双批次重叠策略、最优负载均衡等方式,确保高性能和稳定性。

  此外,文章还披露了DeepSeek利用时间差进行成本控制的策略。DeepSeek V3和R1服务均使用英伟达的H800 GPU,根据白天和晚上的服务负荷差异,动态调整推理节点数量,以降低成本。

  通过这一策略,DeepSeek实现了成本的有效控制,进一步提升了利润率。假定GPU租赁成本为2美元/小时,DeepSeek的总成本为87072美元/天,而理论上一天的总收入可达562027美元/天,成本利润率高达545%。然而,DeepSeek也指出,实际收入可能因V3定价较低及夜间折扣而有所减少。

  为了吸引更多用户,DeepSeek还推出了错峰优惠活动。在优惠时段(北京时间00:30-08:30),API调用价格大幅下调,其中DeepSeek-V3降至原价的50%,DeepSeek-R1降至25%。这一举措旨在鼓励用户在低谷时段调用API,享受更经济、更流畅的服务体验。

  开源周圆满结束,DeepSeek未来可期

  随着最后一枚“重磅炸弹”的发布,DeepSeek的开源周活动正式落下帷幕。在过去的一周里,DeepSeek每天开源一个代码库,展示了其强大的技术实力。

  业内人士分析认为,DeepSeek这一系列技术组件共同构建了一套精密协同的系统,让DeepSeek在有限算力之下最大程度地发挥了GPU的性能,实现了训练推理效率的大幅提升。

  DeepSeek的开源之举也赢得了国外网友的广泛赞誉。不少网友表示,DeepSeek愿意公布这些信息,说明他们已经达到了领先的水平,实际的技术能力可能更高。甚至有网友将DeepSeek与OpenAI进行对比,认为DeepSeek的性价比远高于OpenAI。

  作为大模型领域的“鲶鱼”,DeepSeek的持续创新给行业带来了巨大压力。据外媒透露,DeepSeek正在加速研发DeepSeek-R2推理模型,这一模型有望生成更好的代码,并使用英语之外的语言进行推理。这一消息让外界对DeepSeek充满了期待。

  从V3到R1,再到即将面世的R2,DeepSeek以持续的技术突破惊艳世界。虽然开源周已经结束,但DeepSeek的未来之路仍然充满无限可能。

(文章来源:证券时报)