AI导读:

6月4日,长江证券发表报告称,DeepSeekR1模型完成小版本升级,新版本在思维深度与推理能力上显著提升,整体性能接近国际顶尖模型。同时,DeepSeek持续推动开源,助力我国大模型性能达到领先水平。

6月4日,长江证券发表研究报告指出,5月28日,DeepseekR1模型成功完成小版本升级,最新版本为DeepSeek-R1-0528。用户通过官网、App或小程序进入对话界面,开启“深度思考”功能,即可体验该版本。同时,API也已同步更新,调用方式保持不变。

DeepSeek-R1-0528版本在思维深度与推理能力上有了显著提升,整体性能已接近国际顶尖模型水平。该版本使用DeepSeekV3Base模型作为基座,并在后训练过程中增加了算力投入,使得模型的思维深度与推理能力得到大幅提升。在AIME2025测试中,新版模型的准确率从70%提升至87.5%。这一提升得益于模型在推理过程中思维深度的增强,新版模型在解题过程中进行了更为详尽和深入的思考,整体表现已接近o3与Gemini-2.5-Pro等国际顶尖模型。

除了深度思考能力的强化,DeepSeek-R1-0528在幻觉改善、创意写作、工具调用、前端代码生成、角色扮演等领域的能力也得到了更新和提升。特别是针对“幻觉”问题进行了优化,使得在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45~50%左右,从而能够提供更准确、可靠的结果。这些更新显著提升了DeepSeek-R1-0528的可用性,为其更广泛的应用奠定了坚实基础。

DeepSeek持续推动开源,助力我国大模型性能达到领先水平。此次,DeepSeek公布了DeepSeek-R1-0528的模型权重,其开源仓库(含模型权重)继续采用MITLicense,允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。在开源模式下,DeepSeek吸引了更多开发者参与合作开发,推动我国大模型性能不断演进。此前,英伟达CEO黄仁勋曾称赞DeepSeek和阿里巴巴的通义千问(Qwen)为“当前表现最优的开源AI模型之一”,表明我国开源大模型已达到领先水平。

(文章来源:财中社)