AI导读:

  北京时间4月24日凌晨,OpenAI发布新一代大模型GPT-5.5。OpenAI称其为“迄今为止最智能、最直观易用的模型”,也是计算机工作方式革新的重要一步。
  在发布后的记者电话会上,OpenAI联合创始人Greg Brockman表示,GPT-

  北京时间4月24日凌晨,OpenAI发布新一代大模型GPT-5.5。OpenAI称其为“迄今为止最智能、最直观易用的模型”,也是计算机工作方式革新的重要一步。

  在发布后的记者电话会上,OpenAI联合创始人Greg Brockman表示,GPT-5.5是向“更具代理性和直观的计算”迈进的“重大进步”。Brockman还透露,该模型让OpenAI距离打造“超级应用”更近了。OpenAI此前曾设想将ChatGPT、Codex和AI浏览器整合到一个统一服务中。

  图片来源:OpenAI网站

  同日,DeepSeek全新系列模型DeepSeek-V4的预览版本上线并同步开源。据介绍,DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。

  记者注意到,无论是OpenAI、还是DeepSeek,其最新发布的模型,都着重于在提高模型性能表现的同时,提高效率并降低成本,致力于通过创新打破行业里模型越聪明便越慢、越贵的默认规律。

OpenAI迭代速度加快

  OpenAI介绍,GPT-5.5在显著提升智能水平的同时,保持了与上一代GPT-5.4相当的推理延迟,在效率方面,GPT-5.5完成相同的Codex任务所需的Token数量显著减少。

  4月24日,英伟达在其网站发文称,GPT-5.5运行在其GB200 NVL72机架式系统上。与上一代系统相比,每百万Token的成本降低了35倍,每兆瓦每秒Token输出量提高了50倍。英伟达还表示,双方表示合作已持续十年。OpenAI已承诺为其下一代AI基础设施部署超过10GW的英伟达的系统,这一建设将使数百万个英伟达GPU成为OpenAI未来数年模型训练和推理的基础。

  据OpenAI介绍,GPT-5.5能够更快地理解用户意图,擅长编写和调试代码、在线搜索、分析数据、创建文档和电子表格、操作软件以及在不同工具间灵活切换直至完成任务。得益于“跨上下文推理和持续执行能力”的提升,该模型在智能体编程、计算机使用、知识工作和早期科学研究等领域优势尤为显著。

  OpenAI还展示了和Claude Opus 4.7、Gemini 3.1 Pro等的对比数据,并表示已经全面超越其他模型对手。

  Brockman表示:“这个模型是朝着我们未来期望的计算方式迈出的重要一步——但这只是第一步,我们预计未来还会出现更多进展。”

  值得关注的是,GPT-5.5距离OpenAI上一代GPT-5.4的发布仅间隔六周。以及4月21日,OpenAI还发布了ChatGPT Images 2.0。

  快节奏发布背后,是OpenAI迅速膨胀的融资规模和业绩压力。4月初,OpenAI宣布完成一轮创纪录的融资,融资总规模达1220亿美元,投后估值达8520亿美元。财务数据显示,OpenAI目前月营收达20亿美元,去年全年营收为131亿美元。截至今年3月,ChatGPT周活跃用户已超过9亿,付费订阅用户突破5000万。

DeepSeek新模型性能比肩顶级闭源模型

  根据DeepSeek介绍,此次发布的V4模型按大小分为pro和flash两个版本。其中,DeepSeek-V4-Pro的性能比肩顶级闭源模型。相比前代模型,DeepSeek-V4-Pro的Agent能力显著增强。在Agentic Coding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。目前DeepSeek-V4已成为公司内部员工使用的Agentic Coding模型。

  图片来源:DeepSeek微信公众号

  在世界知识测评中,DeepSeek-V4-Pro也大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。在推理性能表现上,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。

  另一个版本DeepSeek-V4-Flash,则具有更快捷高效的性价比。由于模型参数和激活更小,V4-Flash能够提供更加快捷、经济的API服务。在Agent测评中,DeepSeek-V4-Flash在简单任务上与DeepSeek-V4-Pro旗鼓相当,但在高难度任务上仍有差距。

  值得一提的是,DeepSeek-V4开创了一种全新的注意力机制,在Token维度进行压缩,结合DSA稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。DeepSeek还宣布,从现在开始,1M(一百万)上下文将是DeepSeek所有官方服务的标配。

  “不诱于誉,不恐于诽,率道而行,端然正己。”DeepSeek表示,将始终秉持长期主义的原则理念,努力向实现AGI的目标不断靠近。

  DeepSeek坦言,受限于高端算力,目前Pro版本的API访问服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。

(文章来源:中国证券报)