AI导读:

国家安全部发文称,人工智能训练数据存在虚假信息等问题,造成数据源污染,干扰模型训练,削弱性能并可能诱发有害输出。

  国家安全部今日发文指出,人工智能的训练数据存在严重问题,数据质量良莠不齐,虚假信息、虚构内容及偏见性观点充斥其中,造成数据源污染,为人工智能安全带来全新挑战。通过篡改、虚构和重复等“数据投毒”行为,污染数据将严重干扰模型训练阶段的参数调整,进而削弱模型性能、降低准确性,甚至诱发有害输出。研究显示,训练数据集中虚假文本比例极低时(如0.01%),模型输出的有害内容也会显著增加(11.2%);即便是0.001%的虚假文本,有害输出也会上升7.2%。

(文章来源:人民财讯)