AI导读:

当地时间8月7日,OpenAI推出大型语言模型GPT-5,历经多次推迟后终于面世。该模型智能性能卓越,在编码、数学、写作、健康、视觉感知等领域均有显著提升,将面向所有用户开放。

当地时间8月7日,OpenAI推出大型语言模型GPT-5,历经多次推迟后终于面世,距离GPT-4发布已过去两年半。OpenAI称其为“世界上最好的模型”,将免费提供给用户。

图片来源:OpenAI官网

首席执行官山姆·奥尔特曼形容,与GPT-5对话“就像在与某个领域的博士级专家交流”。该版本首次采用集成模型架构,根据任务自动选择推理深度。

目前Plus、Pro、团队和免费用户均已接入GPT-5,企业版与教育版用户预计一周内覆盖,免费用户数天内完成覆盖。

也有业内人士认为GPT-5“不够惊艳”,马斯克称其在ARC-AGI-2上没有打败Grok 4。

面向所有用户开放

GPT-5智能性能远超公司之前所有模型,在编码、数学、写作、健康、视觉感知等领域均表现卓越。声明称,GPT-5是统一系统,能识别何时快速响应,何时需要更长时间思考。

OpenAI表示,GPT-5将面向所有用户开放,C端免费用户也可使用,但有使用次数限制。Plus用户使用额度“高得多”,Pro会员可访问GPT-5 Pro版本。

对于开发者API用户,GPT-5价格每百万token输入1.25美元,输出10美元,比GPT 4o和Claude Opus 4.1更便宜。

先前,奥尔特曼称GPT-5是“重大升级”。ChatGPT团队负责人Nick Turley表示,新模型在响应速度、回答准确性及减少“幻觉”方面优于前代。

在简报会上,奥尔特曼对GPT-5给予极高评价,称其为通往AGI的重要里程碑。

一键生成网页、像诗人一样写作、更懂健康问题

GPT-5在三个关键领域实现显著提升:编程能力突出,能创建美观响应式网站、应用程序App和游戏;在创意写作方面,能处理复杂写作任务,犹如诗人;健康咨询是第三个重要提升领域,能更积极地标记潜在健康问题。

在SWE-bench Verified测试中,GPT-5准确率达74.9%,高于Claude Opus 4.1和Gemini 2.5 Pro。在Humanitys Last Exam测试中,GPT-5 pro得分42%,略低于Grok 4 Heavy。

OpenAI还为GPT-5引入新的安全训练形式,名为安全补全,教模型在安全范围内给出最有帮助的答案。

推出四种可选的ChatGPT聊天预设性格

OpenAI称,GPT-5在指令执行方面表现提升,将为所有ChatGPT用户推出四种预设性格的全新研究预览版。

初始四种性格选项——愤世嫉俗者、机器人、倾听者和书呆子,用户可在设置中随时调整。

上述四种性格最初适用于文本聊天,之后将扩展到语音聊天。

此外,微软在GPT-5发布当日即宣布,将其整合到广泛的产品线中。Microsoft 365 Copilot将利用GPT-5更好地处理复杂问题,企业用户可通过推理功能处理电子邮件、文档和文件。

对于消费者,Microsoft Copilot的新智能模式将利用GPT-5帮助用户发现最佳解决方案,用户可通过copilot.microsoft.com或Windows、Mac、Android和iOS设备上的Copilot应用免费体验。

开发者将通过GitHub Copilot和Visual Studio Code获得GPT-5支持,Azure AI Foundry平台将提供所有GPT-5模型。

马斯克拆台

在GPT-5发布会上,现场出现小bug,直播中展示的性能图表存在数据与图表显示不匹配的情况。马斯克也转发消息称GPT-5在ARC-AGI-2上没有打败Grok 4。

据证券时报报道,有人工智能资深研究员认为,GPT-5仍是“渐进式优化”,而非颠覆性提升。核心原因在于大模型训练遵循Scaling Laws,如今这一定律正在放缓,预训练带来的边际收益在减弱。

GPT-5发布或许还与OpenAI近期资本运作有关。据参考消息网援引《金融时报》网站报道,OpenAI已获得83亿美元新资本,估值达到3000亿美元。

GPT-5的发布,将进一步巩固OpenAI在大模型技术领域的领先优势,提振投资者信心。

(文章来源:每日经济新闻)