DeepSeek-R1引发热议，中国AI大模型挑战全球巨头

国内财经 2025-01-26 15:28:59 来源：澎湃新闻作者：网络

AI导读：

DeepSeek公司发布的最新AI大模型DeepSeek-R1在海外引起热议，凭借卓越性能和极低训练成本，挑战全球AI巨头。该模型采用开源方式，支持免费商用和衍生开发，成为美国顶尖大学研究人员的首选。同时，DeepSeek-R1的成功也引发了市场对AI竞赛成本效益的关注。

国产大模型公司深度求索（Deepseek）近期发布的最新AI（人工智能）大模型DeepSeek-R1，在海外开发者和投资者中掀起热议浪潮。这一创新成果不仅展示了中国AI技术的飞速进步，更对全球AI竞赛格局产生了深远影响。

1月20日，量化巨头幻方量化旗下的大模型公司DeepSeek正式推出了其推理大模型DeepSeek-R1。作为一款开源模型，DeepSeek-R1在数学、代码、自然语言推理等任务上的性能卓越，足以与OpenAI的ChatGPT-4o模型相媲美。更令人瞩目的是，该模型采用了MIT许可协议，支持免费商用、任意修改和衍生开发，极大地降低了AI技术的门槛。在国外知名大模型排名榜Chatbot Arena上，DeepSeek-R1的基准测试排名迅速攀升至全类别大模型第三，与ChatGPT-4o最新版并列，同时在风格控制类模型分类中荣获第一。

DeepSeek-R1的预训练费用仅为557.6万美元，这在AI模型训练成本高昂的背景下显得尤为突出。该模型在2048块英伟达H800 GPU集群上运行55天完成训练，成本仅为OpenAI GPT-4o模型训练成本的不到十分之一。DeepSeek透露，R1在后训练阶段大规模运用了强化学习技术，即便在标注数据有限的情况下，也显著提升了模型的推理能力。此外，DeepSeek不仅公开了R1的全部训练技术，还向社区开源了6个小模型，允许用户借此训练其他模型，进一步推动了AI技术的普及和发展。

开源模型崛起，性价比远超OpenAI

DeepSeek-R1凭借其“物美价廉”的特性，在海外开发者社区中引发了巨大轰动。在API定价方面，DeepSeek R1服务对每百万输入token收取0.55美元，对每百万输出token收取2.19美元/百万，而OpenAI最新版ChatGPT-4o模型的相应收费则分别为15美元/百万和60美元/百万。海外AI社区中的知名研究者Shubham Saboo表示，作为一款“100%开源”的模型，R1比ChatGPT-4o便宜96.4%，同时提供类似的性能，他建议已经订阅ChatGPT的开发者考虑转向R1。

DeepSeek-R1不仅性能卓越，还为AI大模型的搭建提供了新的思路。英伟达高级研究科学家Jim Fan认为，DeepSeek-R1可能是“首个展示了RL（强化学习）飞轮可以发挥作用且能带来持续增长的OSS（开源软件）项目”。DeepSeek的论文显示，R1完全由强化学习驱动，证明了直接强化学习的可行性，这与过去AI模型依赖监督微调的传统方式截然不同。

硅谷知名投资机构A16z的合伙人Anjney Midha表示，DeepSeek-R1几乎在一夜之间成为美国顶尖大学研究人员的首选模型。德国马克斯·普朗克量子光学研究所AI科学家实验室负责人马里奥·克伦也盛赞DeepSeek-R1的开放性，相比之下，OpenAI旗下的模型则显得“本质上都是黑箱”。

DeepSeek-R1的极低训练成本同样震撼了华尔街和投资者。风险投资巨头安德森·霍洛维茨基金的联合创始人马克·安德森对DeepSeek-R1表示了高度赞赏，认为它是“最令人惊叹和印象深刻的突破之一”。法国企业家阿诺德·贝特朗也称中国AI的发展速度令人惊艳，DeepSeek时刻让世界意识到中国在技术和创新方面已经赶上了美国，甚至在某些领域超过了美国。

在近日举办的2025年达沃斯论坛上，AI科技初创公司Scale AI创始人亚历山大·王表示，DeepSeek的AI大模型性能与美国最好的模型相当。他此前就评价道，DeepSeek以更便宜、更快、更强的产品迎头赶上，展示了中国AI的强劲实力。

Meta首席AI科学家杨立昆指出，比起“中国AI超越了美国”的观点，DeepSeek-R1更重要的是证明了“开源模型正在超越专用模型”。他强调，开源研究和开源项目的力量不可小觑，DeepSeek正是受益于这些资源。

360创始人周鸿祎也发视频谈“中国大模型DeepSeek反超GPT”，称中美AI竞争最终将是中国胜利。他认为DeepSeek这家公司及其创始人非常低调，其技术能力和未来前景被市场严重低估了。

AI竞赛加速，成本效益成焦点

DeepSeek-R1的横空出世引发了市场对美国科技巨头们一味“砸钱”投入AI竞赛的担忧。分析指出，AI行业竞争或将以比预想中更快的速度加剧，并可能影响到上游AI硬件企业的收入。加州大学伯克利分校的AI政策研究员Ritwik GuPTA表示，DeepSeek-R1的出现证明了“AI能力没有技术护城河”，中国的系统工程师人才库比美国大得多，他们更懂得如何高效利用计算资源来训练和运行模型。

据报道，Meta内部已经因为DeepSeek-R1而进入“恐慌模式”。Meta的工程师们正在争分夺秒地分析DeepSeek，试图复制其中一切可能的技术。同时，感受到竞争压力的Meta计划大幅扩张AI团队，并在2025年投资600亿至650亿美元用于资本支出。

谷歌员工也回应称，DeepSeek的疯狂举动让OpenAI、谷歌和Anthropic等竞争对手都感到了压力。他认为这是一件好事，可以见证公开竞争对创新的推动作用。

随着AI技术的飞速发展，成本效益将成为未来AI竞赛的关键因素之一。DeepSeek-R1的成功不仅展示了中国AI技术的实力，更为全球AI竞赛带来了新的思考和启示。

（文章来源：澎湃新闻）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。