DeepSeek发布R1模型更新,强化深度思考与幻觉改善
AI导读:
DeepSeek发布R1模型更新,强化深度思考与幻觉改善,新模型在数学、编程及通用逻辑测评中取得领先成绩,接近国际顶尖模型,同时针对幻觉问题进行优化,降低了幻觉率,并提供更为准确的结果。
在开源平台HuggingFace上发布R1模型的更新后,5月29日晚,Deepseek终于发布了官方公告,详细介绍这次版本的具体能力迭代细节,如深度思考能力强化、幻觉改善和创意写作优化等。
在测评数据方面,官方指出,更新后的R1模型在数学、编程及通用逻辑等多个基准测评中取得了国内领先成绩,接近国际顶尖模型o3与Gemini-2.5-Pro的表现。
值得一提的是,DeepSeek针对新版R1的“幻觉”问题进行了优化。相比旧版,新模型在改写润色、总结摘要、阅读理解等场景中的幻觉率降低了45%-50%,提供了更为准确的结果。
所谓幻觉,即大模型的“胡说八道”。此前,DeepSeek的幻觉率问题备受关注。SuperCLUE的测评显示,DeepSeek-R1模型的幻觉率约为21%,排名国内第五。而推理模型的平均幻觉率高于非推理模型。
此外,新R1模型在复杂推理任务中表现显著提升,如在AIME 2025数学基准测试中,准确率从70%提升至87.5%。同时,针对议论文、小说等文体进行了优化,能输出更长、结构更完整的长篇作品,风格更贴近人类偏好。
众多测试表明,R1新模型的代码能力显著提升,在Live CodeBench平台表现接近OpenAI的o3-high模型。DeepSeek表示,R1-0528基于V3 Base模型,投入更多算力,提升了思维深度与推理能力。
新模型参数为685B,开源版本上下文长度为128K(部分平台提供64K)。开源模型权重采用MIT License,允许用户利用模型输出进行训练。
用户期待DeepSeek下一代R2模型,但公司未回应相关猜测。DeepSeek之后,大模型领域的竞争仍在继续。
(文章来源:第一财经)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

