又要颠覆设计行业?OpenAI炸场发布Images 2.0,中文不再乱码、超越谷歌登顶
AI导读:
OpenAI炸场!或许你已经被真假难辨的AI图片刷屏了。
当地时间4月22日,人工智能巨头OpenAI正式发布最新图像生成模型ChatGPT Images 2.0。
据官方介绍,这是一款能够承担复杂的视觉任务,并生成精准、立即可用视
OpenAI炸场!或许你已经被真假难辨的AI图片刷屏了。
当地时间4月22日,人工智能巨头OpenAI正式发布最新图像生成模型ChatGPT Images 2.0。
据官方介绍,这是一款能够承担复杂的视觉任务,并生成精准、立即可用视觉效果的最先进模型。模型在详细指令遵循、物体的精准放置与关联以及密集文本渲染方面有了巨大进步,并支持多种宽高比生成。其构图感和视觉审美意味着生成的结果感觉不那么像“AI生成”,而更像是经过精心设计。
值得一提的是,ChatGPT Images 2.0在多种语言中(特别是日语、韩语、中文、印地语和孟加拉语)都能保持精准,并利用其扩展的视觉和世界知识填补空白,用户只需更少的提示词就能获得更智能的图像。
据介绍,为了扩展模型处理最复杂任务的能力,Images 2.0还具备思维链(Thinking)能力。当选择思维模式或Pro模型时,Images 2.0可以搜索网络获取实时信息、根据一个提示词创建多个不同的图像,并自我复核其输出。
同时,该模型的知识截止日期为2025年12月,也意味着可以生成更相关且符合语境的准确输出。
OpenAI表示,该模型将图像生成从单纯的渲染提升到了战略设计的高度,从一种工具转变为一个视觉系统,帮助人们将想法转化为可以理解、分享、用于教学并在此基础上构建的成果。这也让不少网友惊呼设计行业又一次要被颠覆。
同时,由于生成的图片真假难辨,OpenAI强调公司致力于构建有用、具有创造力且安全的图像生成技术,并对此采取了端到端的安全方法:努力防止有害输出,实施强有力的保障措施,并会随着能力和风险的发展不断加强保护。
一经发布,GPT-Image-2便迅速登上模型竞技场Image Arena所有排行榜榜首。在“文本转图像”类别中位列第一名 (1512 分),领先第二名242分(Nano-banana-2 with web-search,又名 gemini-3.1-flash-image),Image Arena表示“这是我们迄今为止见过的最大差距”,“单图编辑”类别第一名 (1513 分),领先第二名125 分(Nano-banana-pro,又名 gemini-3-pro-image),“多图编辑”类别第一名 (1464 分),领先第二名90分(Nano-banana-2)。
目前,ChatGPT Images 2.0已向所有ChatGPT和Codex用户开放,带有思维链功能的高级输出可供 ChatGPT Plus、Pro和Business用户使用。gpt-image-2模型已在API中提供;定价根据所选图像的质量和分辨率而有所不同。
Images 2.0的发布无疑展现了OpenAI在视觉生成领域的统治力,然而技术的每一次狂飙突进,都伴随着未知的暗流。不久前,因公众对AI取代人类的深度焦虑,OpenAI CEO山姆·奥特曼(Sam Altman)的住宅曾遭遇袭击。如今,这种焦虑是否会进一步加剧?奥特曼想用技术征服世界,但如何化解大众的焦虑和信任危机,或许是他和OpenAI面临的更难关卡。
网友用ChatGPT Images 2.0生成的OpenAI和Anthropic两位CEO“牵手照”,真实情况是当时拒绝了牵手。
(文章来源:澎湃新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

