OpenAI新模型o3和o4-mini赋能AI视觉推理能力
AI导读:
OpenAI发布最新大模型o3和o4-mini,赋予AI视觉推理能力,引发社交平台“推理游戏”。AI能准确识别并回复照片拍摄地点,引发隐私担忧。专家提醒用户加强安全意识,AI厂商应设定安全边界。
凌晨,OpenAI发布了最新大模型o3和o4-mini,赋予AI视觉推理能力,使其不仅能理解图像,还能基于图像细节进行逐步推理。这一变革在社交平台上掀起了一场新的“推理游戏”。
众多网友发现,无论是街头、餐厅角落,还是无标志的高速公路照片,上传至ChatGPT后,AI都能精确指出拍摄地点。在X社交平台上,网友们复兴起“GeoGuessr”挑战,这一次的主角变成了AI。
国内社交平台也迎来了这一测试。21记者观察到,有用户拍摄了一张早高峰的马路照片,上传给ChatGPT o3,询问地点及具体道路名称。AI通过车牌“鲁U”锁定山东青岛市,结合邮政局店面信息及周边店铺验证,准确报出了道路名称。
另一AI从业者卡兹克测试了更具挑战性的高速公路照片。仅凭车牌远景、植被和道路情况,ChatGPT便定位到“北京门头沟山区109号国道”,且不含Exif信息,完全依靠图像细节推理。
(图|X社交平台)
这一精准推理得益于o3和o4-mini将图像识别、逻辑推理与外部工具调用相结合。21记者测试了Deepseek、元宝、豆包、GPT-4o等国内外大模型,虽都能分析图片位置,但准确率极低。关键在于,o3和o4-mini能同时识图与联网比对。
此外,图像纳入推理链条,意味着AI不仅能猜地点,还能解题。用户上传黑板、教材或手绘草图,即使图像模糊,o3和o4-mini也能解析。
然而,这一技术也引发隐私担忧。网友担忧其成为刑侦调查神器,增加隐私泄露风险。网络安全专家彭根表示,AI视觉能力是双刃剑,但整体赞同技术进步。同时,他提醒用户上传照片前加强安全意识,建议AI厂商为图片分析能力设定安全边界。
微信曾因原图泄露位置信息引发关注。智能手机照片自带Exif参数,记录拍摄地点等隐私信息。因此,拍照设备和社交平台加强了照片隐私防护,但仍存风险。AI仅凭图像内容即可还原地点,甚至进行人物推理,隐私风险大增。
OpenAI对o3与o4-mini加入了防护措施,拒绝识别人物身份,避免提供无依据推理。然而,在“图像推理定位”功能上,OpenAI未设置警告,也未限制使用范围。目前,o3仅供付费用户使用,o4-mini则向所有免费用户开放试用。
(文章来源:21世纪经济报道)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

