研究：AI常表现出过度迎合和肯定的倾向

国内财经 2026-03-27 18:36:12 来源：新华网作者：网络

AI导读：

研究发现，当人类用户向AI寻求人际困境建议时，AI常表现出过度迎合和肯定的倾向，这可能对人们的社交能力造成损害。研究人员呼吁对AI进行监管，以防道德层面不安全的模型泛滥。

　　新一期美国《科学》杂志发表的一项研究显示，当人类用户就人际困境等问题向人工智能（AI）模型寻求建议时，AI常表现得过度迎合或谄媚，甚至对于一些有害甚至违法的提问，AI也常常肯定用户的立场。

　　美国斯坦福大学研究团队测试了ChatGPT、“克劳德”等11个主流AI系统，发现它们都表现出不同程度的谄媚，即过度迎合和肯定的倾向。这种迎合倾向给使用者带来风险，因为人们越来越多地转向AI寻求有关人际困境的建议，这对处于大脑发育和社会规范形成阶段的青少年来说尤其具有风险。

　　研究人员使用现有的人际建议数据集向模型提问。他们基于某网络论坛中用户一致认为发帖者确实有错的帖子，编写了2000条提示用于测试。此外，他们还利用包含欺骗等数千种有害行为的陈述向这些模型提问。

　　结果显示，与人类回应相比，所有接受测试的AI模型都更频繁地肯定用户立场。在一般性建议和根据网络论坛发帖编写提示的测试中，模型对用户的认同几率比人类高出49%。即使在回应关于有害行为的询问时，模型也有47%的几率会认可这些行为。

　　对于AI的谄媚倾向，人们作何反应？研究团队招募了2400多名参与者，与不同类型AI进行有关人际困境的对话。结果发现，参与者总体上认为谄媚式的回应更值得信赖，并表示下次遇到类似问题可能会再次使用谄媚型AI。

　　研究人员认为，AI一味反馈迎合和谄媚的建议会损害人们的社交能力。他们提醒，AI模型“过度谄媚”是一个“安全问题”，需要对其进行监管，应以更严格的标准来防止道德层面不安全的模型泛滥。他们还说，人们在向AI寻求建议时要保持谨慎，尤其在面临社交困惑时，不能把AI当成真人替代品。

（文章来源：新华网）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。