DeepSeek发布R1模型更新，强化深度思考与幻觉改善

财经聚焦 2025-05-29 22:11:09 来源：第一财经作者：网络

AI导读：

DeepSeek发布R1模型更新，强化深度思考与幻觉改善，新模型在数学、编程及通用逻辑测评中取得领先成绩，接近国际顶尖模型，同时针对幻觉问题进行优化，降低了幻觉率，并提供更为准确的结果。

在开源平台HuggingFace上发布R1模型的更新后，5月29日晚，Deepseek终于发布了官方公告，详细介绍这次版本的具体能力迭代细节，如深度思考能力强化、幻觉改善和创意写作优化等。

在测评数据方面，官方指出，更新后的R1模型在数学、编程及通用逻辑等多个基准测评中取得了国内领先成绩，接近国际顶尖模型o3与Gemini-2.5-Pro的表现。

值得一提的是，DeepSeek针对新版R1的“幻觉”问题进行了优化。相比旧版，新模型在改写润色、总结摘要、阅读理解等场景中的幻觉率降低了45%-50%，提供了更为准确的结果。

所谓幻觉，即大模型的“胡说八道”。此前，DeepSeek的幻觉率问题备受关注。SuperCLUE的测评显示，DeepSeek-R1模型的幻觉率约为21%，排名国内第五。而推理模型的平均幻觉率高于非推理模型。

此外，新R1模型在复杂推理任务中表现显著提升，如在AIME 2025数学基准测试中，准确率从70%提升至87.5%。同时，针对议论文、小说等文体进行了优化，能输出更长、结构更完整的长篇作品，风格更贴近人类偏好。

众多测试表明，R1新模型的代码能力显著提升，在Live CodeBench平台表现接近OpenAI的o3-high模型。DeepSeek表示，R1-0528基于V3 Base模型，投入更多算力，提升了思维深度与推理能力。

新模型参数为685B，开源版本上下文长度为128K（部分平台提供64K）。开源模型权重采用MIT License，允许用户利用模型输出进行训练。

用户期待DeepSeek下一代R2模型，但公司未回应相关猜测。DeepSeek之后，大模型领域的竞争仍在继续。

（文章来源：第一财经）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。