AI导读:

2026北京人工智能创新高地建设推进会发布8大前沿成果,包括由北京前瞻人工智能安全与治理研究院发布的“前瞻人工智能安全评估体系与基座平台”,探讨以安全为基石引领人工智能稳健发展。

新京报贝壳财经讯(记者罗亦丹)2026北京人工智能创新高地建设推进会于1月5日举办,会上发布北京人工智能8大前沿成果。其中,由北京前瞻人工智能安全与治理研究院发布的“前瞻人工智能安全评估体系与基座平台”在列。

作为人工智能安全与治理的代表性北京创新成果,“前瞻人工智能安全评估体系与基座平台”探讨如何以安全为基石,引领人工智能的稳健发展。该体系打破传统安全评估的单一维度局限,形成了全领域、多层次的评估框架。

前瞻院通过测试发现了一个关键问题:近年来的大模型在安全性方面并未明显提升,部分新近模型的攻击成功率甚至更高。同时前瞻院也验证了一个重要结论:人工智能模型防御并不必然需要重新训练模型,在在线推理阶段通过部署安全护栏,就能显著提升模型安全水平。

此外,前瞻院还构建了 “前瞻·灵度”AI 伦理评估平台,专注于AI伦理的智能评估与价值校准。平台能够对上百个大模型进行实时动态监控与并行测试,评估其在六大维度、90 个细分类别的伦理合乎度。

前瞻院认为,人工智能安全应成为 “第一性原理”,是不可删除、无法违背的底线要求。

(文章来源:新京报)