DeepSeek-R1引发热议,中国AI大模型挑战全球巨头
AI导读:
DeepSeek公司发布的最新AI大模型DeepSeek-R1在海外引起热议,凭借卓越性能和极低训练成本,挑战全球AI巨头。该模型采用开源方式,支持免费商用和衍生开发,成为美国顶尖大学研究人员的首选。同时,DeepSeek-R1的成功也引发了市场对AI竞赛成本效益的关注。
国产大模型公司深度求索(Deepseek)近期发布的最新AI(人工智能)大模型DeepSeek-R1,在海外开发者和投资者中掀起热议浪潮。这一创新成果不仅展示了中国AI技术的飞速进步,更对全球AI竞赛格局产生了深远影响。
1月20日,量化巨头幻方量化旗下的大模型公司DeepSeek正式推出了其推理大模型DeepSeek-R1。作为一款开源模型,DeepSeek-R1在数学、代码、自然语言推理等任务上的性能卓越,足以与OpenAI的ChatGPT-4o模型相媲美。更令人瞩目的是,该模型采用了MIT许可协议,支持免费商用、任意修改和衍生开发,极大地降低了AI技术的门槛。在国外知名大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名迅速攀升至全类别大模型第三,与ChatGPT-4o最新版并列,同时在风格控制类模型分类中荣获第一。
DeepSeek-R1的预训练费用仅为557.6万美元,这在AI模型训练成本高昂的背景下显得尤为突出。该模型在2048块英伟达H800 GPU集群上运行55天完成训练,成本仅为OpenAI GPT-4o模型训练成本的不到十分之一。DeepSeek透露,R1在后训练阶段大规模运用了强化学习技术,即便在标注数据有限的情况下,也显著提升了模型的推理能力。此外,DeepSeek不仅公开了R1的全部训练技术,还向社区开源了6个小模型,允许用户借此训练其他模型,进一步推动了AI技术的普及和发展。
开源模型崛起,性价比远超OpenAI
DeepSeek-R1凭借其“物美价廉”的特性,在海外开发者社区中引发了巨大轰动。在API定价方面,DeepSeek R1服务对每百万输入token收取0.55美元,对每百万输出token收取2.19美元/百万,而OpenAI最新版ChatGPT-4o模型的相应收费则分别为15美元/百万和60美元/百万。海外AI社区中的知名研究者Shubham Saboo表示,作为一款“100%开源”的模型,R1比ChatGPT-4o便宜96.4%,同时提供类似的性能,他建议已经订阅ChatGPT的开发者考虑转向R1。
DeepSeek-R1不仅性能卓越,还为AI大模型的搭建提供了新的思路。英伟达高级研究科学家Jim Fan认为,DeepSeek-R1可能是“首个展示了RL(强化学习)飞轮可以发挥作用且能带来持续增长的OSS(开源软件)项目”。DeepSeek的论文显示,R1完全由强化学习驱动,证明了直接强化学习的可行性,这与过去AI模型依赖监督微调的传统方式截然不同。
硅谷知名投资机构A16z的合伙人Anjney Midha表示,DeepSeek-R1几乎在一夜之间成为美国顶尖大学研究人员的首选模型。德国马克斯·普朗克量子光学研究所AI科学家实验室负责人马里奥·克伦也盛赞DeepSeek-R1的开放性,相比之下,OpenAI旗下的模型则显得“本质上都是黑箱”。
DeepSeek-R1的极低训练成本同样震撼了华尔街和投资者。风险投资巨头安德森·霍洛维茨基金的联合创始人马克·安德森对DeepSeek-R1表示了高度赞赏,认为它是“最令人惊叹和印象深刻的突破之一”。法国企业家阿诺德·贝特朗也称中国AI的发展速度令人惊艳,DeepSeek时刻让世界意识到中国在技术和创新方面已经赶上了美国,甚至在某些领域超过了美国。
在近日举办的2025年达沃斯论坛上,AI科技初创公司Scale AI创始人亚历山大·王表示,DeepSeek的AI大模型性能与美国最好的模型相当。他此前就评价道,DeepSeek以更便宜、更快、更强的产品迎头赶上,展示了中国AI的强劲实力。
Meta首席AI科学家杨立昆指出,比起“中国AI超越了美国”的观点,DeepSeek-R1更重要的是证明了“开源模型正在超越专用模型”。他强调,开源研究和开源项目的力量不可小觑,DeepSeek正是受益于这些资源。
360创始人周鸿祎也发视频谈“中国大模型DeepSeek反超GPT”,称中美AI竞争最终将是中国胜利。他认为DeepSeek这家公司及其创始人非常低调,其技术能力和未来前景被市场严重低估了。
AI竞赛加速,成本效益成焦点
DeepSeek-R1的横空出世引发了市场对美国科技巨头们一味“砸钱”投入AI竞赛的担忧。分析指出,AI行业竞争或将以比预想中更快的速度加剧,并可能影响到上游AI硬件企业的收入。加州大学伯克利分校的AI政策研究员Ritwik GuPTA表示,DeepSeek-R1的出现证明了“AI能力没有技术护城河”,中国的系统工程师人才库比美国大得多,他们更懂得如何高效利用计算资源来训练和运行模型。
据报道,Meta内部已经因为DeepSeek-R1而进入“恐慌模式”。Meta的工程师们正在争分夺秒地分析DeepSeek,试图复制其中一切可能的技术。同时,感受到竞争压力的Meta计划大幅扩张AI团队,并在2025年投资600亿至650亿美元用于资本支出。
谷歌员工也回应称,DeepSeek的疯狂举动让OpenAI、谷歌和Anthropic等竞争对手都感到了压力。他认为这是一件好事,可以见证公开竞争对创新的推动作用。
随着AI技术的飞速发展,成本效益将成为未来AI竞赛的关键因素之一。DeepSeek-R1的成功不仅展示了中国AI技术的实力,更为全球AI竞赛带来了新的思考和启示。
(文章来源:澎湃新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

