Deepseek发布深度推理模型R1-Zero，算力需求低却性能卓越

财经聚焦 2025-02-04 21:18:33 来源：证券时报网作者：网络

AI导读：

中信建投研报指出，Deepseek发布的R1-Zero模型采用纯粹强化学习训练，实现了与OpenAI模型相媲美甚至超越的成绩，且算力需求较低。未来，人工智能模型的算力需求仍将爆发式增长。

证券时报e公司讯，中信建投最新研报指出，Deepseek近期发布了其深度推理能力模型R1-Zero。该模型摒弃了传统方法，采用纯粹的强化学习训练策略，成功验证了大型语言模型仅凭强化学习即可拥有卓越的推理能力。DeepSeek-R1在经过精心微调和强化学习后，其表现已能与OpenAI的GPT-3系列（如o1-1217版本）相媲美，甚至在部分任务中实现了超越。这一成就彰显了DeepSeek R1在算法、框架及硬件层面的优化协同，使得其在训练和推理过程中的算力需求相对较低。

值得注意的是，尽管当前DeepSeek R1已展现出高效的算力利用能力，但随着预训练技术的不断进步，深度推理阶段的人工智能模型对算力的需求仍将呈现爆发式增长。这一趋势预示着，未来人工智能模型的性能提升将更加依赖于充足的算力支持。因此，如何在算法创新与算力优化之间找到最佳平衡点，将成为推动人工智能领域持续发展的关键。

（文章来源：证券时报网，版权归原作者所有，如有侵权请联系删除）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。