AI导读:

北京时间8月8日,GPT-5正式发布。新京报AI研究院实测发现,GPT-5在创意写作和编程方面表现出色,但仍有错误和局限。相比其他模型,GPT-5能力更优,价格也更低,有望加速应用端落地。

  北京时间8月8日,备受期待的GPT-5终于发布,OpenAI首席执行官山姆·奥特曼通过77分钟视频揭晓了这款大模型。

  新京报AI研究院实测发现,接入GPT-5后,ChatGPT对话界面更简洁,集成了多模态、深度思考等功能,用户体验提升。但对复杂问题仍有错误,总体能力未显著拉开差距。

  ChatGPT最新界面截图

  GPT-5在各项跑分测试中领先,但惊艳程度不及GPT-4和o1。在AI大模型快速迭代和国产模型涌现的背景下,GPT-5表现仍需提升。不过,其在工程化和商业化方面表现出色。

  创意写作:中文能力中规中矩,提示词和跨界作图切换“丝滑”

  GPT-5在编程、数学等维度测评中夺得榜首,新京报AI研究院更关注其实操表现。创意写作方面,GPT-5写作能力比GPT-4o好,能生成包含农民故事与旁注史料的完整回答,质量提高。

  面对同样提示词,Deepseek和Kimi也给出不错回复,但ChatGPT在引导用户继续提问上更胜一筹,能主动提供多模态能力调用,提升用户体验。不过,GPT-5生成的图片较为粗陋且与图片说明存在矛盾。

  GPT-5的部分回答截图

  编程能力:速度提升明显,错误依然存在

  OpenAI在发布会中重点介绍了GPT-5的编程能力。新京报AI研究院实测发现,GPT-5编程速度很快,能生成初步交互的程序,但深入体验会发现很多错误。

  GPT-5生成的图片,虽然文字回复优秀但图片与图片说明文字存在矛盾

  总体而言,GPT-5在产品水平和用户体验上有进步,但仍未摆脱大模型固有的幻觉问题。相比其他模型,GPT-5能力优于同类,如编程能力较o3和GPT-4o模型显著提升。

  GPT-5免费开放但有使用次数限制,API价格低于GPT-4o和Gemini 2.5 Pro,仅为Claude Opus 4.1的1/15。开源证券研报认为,此次价格下探有望加速应用端落地。

  GPT-5生成的英语学习游戏

新京报AI研究院罗亦丹

(文章来源:新京报)