国家安全部:警惕人工智能训练数据污染风险
AI导读:
国家安全部发文称,人工智能训练数据存在虚假信息等问题,造成数据源污染,干扰模型训练,削弱性能并可能诱发有害输出。
国家安全部今日发文指出,人工智能的训练数据存在严重问题,数据质量良莠不齐,虚假信息、虚构内容及偏见性观点充斥其中,造成数据源污染,为人工智能安全带来全新挑战。通过篡改、虚构和重复等“数据投毒”行为,污染数据将严重干扰模型训练阶段的参数调整,进而削弱模型性能、降低准确性,甚至诱发有害输出。研究显示,训练数据集中虚假文本比例极低时(如0.01%),模型输出的有害内容也会显著增加(11.2%);即便是0.001%的虚假文本,有害输出也会上升7.2%。
(文章来源:人民财讯)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

