OpenAI新模型o3和o4-mini赋能AI视觉推理能力

财经聚焦 2025-04-19 01:08:13 来源：21世纪经济报道作者：网络

AI导读：

OpenAI发布最新大模型o3和o4-mini，赋予AI视觉推理能力，引发社交平台“推理游戏”。AI能准确识别并回复照片拍摄地点，引发隐私担忧。专家提醒用户加强安全意识，AI厂商应设定安全边界。

　　凌晨，OpenAI发布了最新大模型o3和o4-mini，赋予AI视觉推理能力，使其不仅能理解图像，还能基于图像细节进行逐步推理。这一变革在社交平台上掀起了一场新的“推理游戏”。

　　众多网友发现，无论是街头、餐厅角落，还是无标志的高速公路照片，上传至ChatGPT后，AI都能精确指出拍摄地点。在X社交平台上，网友们复兴起“GeoGuessr”挑战，这一次的主角变成了AI。

　　国内社交平台也迎来了这一测试。21记者观察到，有用户拍摄了一张早高峰的马路照片，上传给ChatGPT o3，询问地点及具体道路名称。AI通过车牌“鲁U”锁定山东青岛市，结合邮政局店面信息及周边店铺验证，准确报出了道路名称。

　　另一AI从业者卡兹克测试了更具挑战性的高速公路照片。仅凭车牌远景、植被和道路情况，ChatGPT便定位到“北京门头沟山区109号国道”，且不含Exif信息，完全依靠图像细节推理。

（图｜X社交平台）

　　这一精准推理得益于o3和o4-mini将图像识别、逻辑推理与外部工具调用相结合。21记者测试了Deepseek、元宝、豆包、GPT-4o等国内外大模型，虽都能分析图片位置，但准确率极低。关键在于，o3和o4-mini能同时识图与联网比对。

　　此外，图像纳入推理链条，意味着AI不仅能猜地点，还能解题。用户上传黑板、教材或手绘草图，即使图像模糊，o3和o4-mini也能解析。

　　然而，这一技术也引发隐私担忧。网友担忧其成为刑侦调查神器，增加隐私泄露风险。网络安全专家彭根表示，AI视觉能力是双刃剑，但整体赞同技术进步。同时，他提醒用户上传照片前加强安全意识，建议AI厂商为图片分析能力设定安全边界。

　　微信曾因原图泄露位置信息引发关注。智能手机照片自带Exif参数，记录拍摄地点等隐私信息。因此，拍照设备和社交平台加强了照片隐私防护，但仍存风险。AI仅凭图像内容即可还原地点，甚至进行人物推理，隐私风险大增。

　　OpenAI对o3与o4-mini加入了防护措施，拒绝识别人物身份，避免提供无依据推理。然而，在“图像推理定位”功能上，OpenAI未设置警告，也未限制使用范围。目前，o3仅供付费用户使用，o4-mini则向所有免费用户开放试用。

（文章来源：21世纪经济报道）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。