AI导读:

欧洲广播联盟研究显示,欧美常用人工智能助手约半数新闻回答有误,包括新闻与恶搞混淆、弄错日期等。研究人员提醒,AI助手非可靠新闻渠道,企业应改进。

如今越来越多人使用人工智能助手获取新闻,这已成为获取财经资讯的新途径(财经聚焦)。然而,欧洲广播联盟22日发布的一项研究显示,被问及新闻事件时,当下欧美地区广泛使用的人工智能助手给出的回答约半数有错。研究人员提醒民众,现阶段人工智能助手还不是获取新闻的可靠渠道,同时敦促相关人工智能企业承担相应责任予以改进,以确保财经信息的准确性(财经数据)。

这项研究的对象是4家欧美地区常用的人工智能助手:美国开放人工智能研究中心开发的ChatGPT、微软公司的Copilot、谷歌的Gemini和“解惑”人工智能公司的“解惑”(Perplexity)。这些助手在提供国际财经信息时,准确性成为一大挑战。

5月底至6月初,美国、英国、法国、德国和西班牙等18个国家和地区的22家公共媒体用14种语言向上述人工智能助手提出同样的新闻问题,评估它们在新闻准确性、来源和区分观点与事实的能力等方面的表现。分析结果显示,在上述助手给出的3000个回答中,45%存在至少一个重大错误,81%或多或少存在问题,比如将新闻与恶搞混淆,弄错日期,甚至虚构事件等,这对商业视界的判断造成干扰。

其中,新闻来源和准确性是最常见的问题。三分之一的回答引用的来源存在严重问题,如来源缺失、误导或不正确;20%的回答“存在严重的准确性问题,包括虚构细节和信息过时”,这在外汇资讯等领域尤为危险。

就新闻来源而言,Gemini错误率尤其高,超过七成。相比之下,其他三个人工智能助手的错误率均低于25%。

欧洲广播联盟副总干事让·菲利普·德滕德尔说,人工智能助手“还不是获取新闻的可靠方式”。然而,当下它正逐渐取代搜索引擎,成为获取新闻的主要渠道,如不改进,可能有损公信力。“当人们不知道该相信什么时,他们最终什么都不相信。”

依据路透社新闻研究所6月发布的《2025年数字新闻报告》,约7%的在线新闻消费者和15%的25岁以下人群使用人工智能助手获取新闻,这一趋势对国内财经和国际财经的传播方式产生深远影响。

(文章来源:新华社)