DeepSeekR1模型升级，推动我国大模型性能达领先水平

财经聚焦 2025-06-04 13:19:19 来源：财中社作者：网络

AI导读：

6月4日，长江证券发表报告称，DeepSeekR1模型完成小版本升级，新版本在思维深度与推理能力上显著提升，整体性能接近国际顶尖模型。同时，DeepSeek持续推动开源，助力我国大模型性能达到领先水平。

6月4日，长江证券发表研究报告指出，5月28日，DeepseekR1模型成功完成小版本升级，最新版本为DeepSeek-R1-0528。用户通过官网、App或小程序进入对话界面，开启“深度思考”功能，即可体验该版本。同时，API也已同步更新，调用方式保持不变。

DeepSeek-R1-0528版本在思维深度与推理能力上有了显著提升，整体性能已接近国际顶尖模型水平。该版本使用DeepSeekV3Base模型作为基座，并在后训练过程中增加了算力投入，使得模型的思维深度与推理能力得到大幅提升。在AIME2025测试中，新版模型的准确率从70%提升至87.5%。这一提升得益于模型在推理过程中思维深度的增强，新版模型在解题过程中进行了更为详尽和深入的思考，整体表现已接近o3与Gemini-2.5-Pro等国际顶尖模型。

除了深度思考能力的强化，DeepSeek-R1-0528在幻觉改善、创意写作、工具调用、前端代码生成、角色扮演等领域的能力也得到了更新和提升。特别是针对“幻觉”问题进行了优化，使得在改写润色、总结摘要、阅读理解等场景中，幻觉率降低了45～50%左右，从而能够提供更准确、可靠的结果。这些更新显著提升了DeepSeek-R1-0528的可用性，为其更广泛的应用奠定了坚实基础。

DeepSeek持续推动开源，助力我国大模型性能达到领先水平。此次，DeepSeek公布了DeepSeek-R1-0528的模型权重，其开源仓库（含模型权重）继续采用MITLicense，允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。在开源模式下，DeepSeek吸引了更多开发者参与合作开发，推动我国大模型性能不断演进。此前，英伟达CEO黄仁勋曾称赞DeepSeek和阿里巴巴的通义千问（Qwen）为“当前表现最优的开源AI模型之一”，表明我国开源大模型已达到领先水平。

（文章来源：财中社）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。