清华瑞莱推出RealSafe-R1大语言模型，应对开源模型安全挑战

财经聚焦 2025-02-24 22:41:15 来源：北京商报作者：网络

AI导读：

清华大学与瑞莱智慧联合推出RealSafe-R1大语言模型，针对DeepSeek在安全性上的局限提出创新解决方案。该模型融合安全对齐与内省推理，实现自主进化，即将向全球开发者开源。

　　北京商报讯（记者魏蔚）2月24日，北京商报记者获悉，清华大学与瑞莱智慧联合推出大语言模型RealSafe-R1，该模型深度优化Deepseek R1，强化后训练效果。近期，国产开源大模型DeepSeek在复杂问题解决和创造性任务中展现卓越性能，备受瞩目。然而，业内人士指出，DeepSeek R1和V3在应对越狱攻击等安全挑战时存在局限，易受恶意输入误导，产生不安全或不符合预期的响应。这一安全短板是开源大模型的普遍问题，根源在于安全对齐机制深度不足。为此，清华瑞莱团队创新提出基于模型自我提升的安全对齐方法，融合安全对齐与内省推理，使大语言模型能通过安全意识的思维链分析潜在风险，实现模型自主进化，适用于多种模型。RealSafe-R1各尺寸模型及数据集，即将向全球开发者开源。

（文章来源：北京商报；关键词：大语言模型、DeepSeek、安全挑战、RealSafe-R1）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。