AI导读:

中信建投研报指出,Deepseek发布的R1-Zero模型采用纯粹强化学习训练,实现了与OpenAI模型相媲美甚至超越的成绩,且算力需求较低。未来,人工智能模型的算力需求仍将爆发式增长。

证券时报e公司讯,中信建投最新研报指出,Deepseek近期发布了其深度推理能力模型R1-Zero。该模型摒弃了传统方法,采用纯粹的强化学习训练策略,成功验证了大型语言模型仅凭强化学习即可拥有卓越的推理能力。DeepSeek-R1在经过精心微调和强化学习后,其表现已能与OpenAI的GPT-3系列(如o1-1217版本)相媲美,甚至在部分任务中实现了超越。这一成就彰显了DeepSeek R1在算法、框架及硬件层面的优化协同,使得其在训练和推理过程中的算力需求相对较低。

值得注意的是,尽管当前DeepSeek R1已展现出高效的算力利用能力,但随着预训练技术的不断进步,深度推理阶段的人工智能模型对算力的需求仍将呈现爆发式增长。这一趋势预示着,未来人工智能模型的性能提升将更加依赖于充足的算力支持。因此,如何在算法创新与算力优化之间找到最佳平衡点,将成为推动人工智能领域持续发展的关键。

(文章来源:证券时报网,版权归原作者所有,如有侵权请联系删除)