DeepSeekR1模型升级,推动我国大模型性能达领先水平
AI导读:
6月4日,长江证券发表报告称,DeepSeekR1模型完成小版本升级,新版本在思维深度与推理能力上显著提升,整体性能接近国际顶尖模型。同时,DeepSeek持续推动开源,助力我国大模型性能达到领先水平。
6月4日,长江证券发表研究报告指出,5月28日,DeepseekR1模型成功完成小版本升级,最新版本为DeepSeek-R1-0528。用户通过官网、App或小程序进入对话界面,开启“深度思考”功能,即可体验该版本。同时,API也已同步更新,调用方式保持不变。
DeepSeek-R1-0528版本在思维深度与推理能力上有了显著提升,整体性能已接近国际顶尖模型水平。该版本使用DeepSeekV3Base模型作为基座,并在后训练过程中增加了算力投入,使得模型的思维深度与推理能力得到大幅提升。在AIME2025测试中,新版模型的准确率从70%提升至87.5%。这一提升得益于模型在推理过程中思维深度的增强,新版模型在解题过程中进行了更为详尽和深入的思考,整体表现已接近o3与Gemini-2.5-Pro等国际顶尖模型。
除了深度思考能力的强化,DeepSeek-R1-0528在幻觉改善、创意写作、工具调用、前端代码生成、角色扮演等领域的能力也得到了更新和提升。特别是针对“幻觉”问题进行了优化,使得在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45~50%左右,从而能够提供更准确、可靠的结果。这些更新显著提升了DeepSeek-R1-0528的可用性,为其更广泛的应用奠定了坚实基础。
DeepSeek持续推动开源,助力我国大模型性能达到领先水平。此次,DeepSeek公布了DeepSeek-R1-0528的模型权重,其开源仓库(含模型权重)继续采用MITLicense,允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。在开源模式下,DeepSeek吸引了更多开发者参与合作开发,推动我国大模型性能不断演进。此前,英伟达CEO黄仁勋曾称赞DeepSeek和阿里巴巴的通义千问(Qwen)为“当前表现最优的开源AI模型之一”,表明我国开源大模型已达到领先水平。
(文章来源:财中社)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

