OpenAI开源GPT-OSS模型 引发AI行业新关注
AI导读:
OpenAI首席执行官宣布推出两款开源AI推理模型GPT-OSS,包括1170亿参数的gpt-oss-120b和210亿参数的gpt-oss-20b,均采用Apache 2.0许可证发布,商用无需付费。性能位于开源模型第一梯队,但略逊于自家闭源模型,且存在更多幻觉现象。市场普遍预期OpenAI后续将推出GPT-5。
OpenAI首席执行官山姆·奥尔特曼周二宣布,公司将在未来几天里带来许多新东西,其中周二会迎来一项“小而重磅”的更新——预热已久的开源模型GPT-OSS。
简单而言,OpenAI周二共发布两款开放权重AI推理模型。其中参数量达到1170亿的gpt-oss-120b能力更强,可以由单个英伟达专业数据中心GPU驱动;参数量210亿的gpt-oss-20b模型,则能够在配备16GB内存的消费级笔记本电脑上运行。
虽然公司名字叫OpenAI,但这已经是2019年的GPT-2后,这家AI初创公司时隔6年首度推出开源模型。在今年1月Deepseek引爆开源AI风暴后,奥尔特曼曾认错称OpenAI在开源技术方面“站在了历史的错误一边”,这正是OpenAI重新推出开源模型的原因。
两款模型都以宽松的Apache 2.0许可证发布,企业在商用前无需付费或获得许可。
就模型性能而言,GPT-OSS大致位于开源模型的第一梯队,但整体略逊于自家的GPT-o3和o4-mini。
例如在Codeforces(带工具)的编程测试中,gpt-oss-120b和gpt-oss-20b的“跑分”分别为2622和2516分,虽然高于一些头部开源模型,但依然比不过头部闭源推理模型。
类似的情况也发生在“人类最后的考试”测试中,两款开源模型的得分分别为19%和17.3%,同样比不过o3。
与闭源模型类似,两款开放模型都采用了混合专家(MoE)技术,处理问题时只会激活较少的参数。对于1170亿参数量的gpt-oss-120b,处理每一个token时仅激活51亿个参数。
值得注意的是,相较o3和o4-mini模型,两款开放模型也会出现更多的幻觉。OpenAI解释称,由于较小的模型拥有的世界知识比大型前沿模型少,所以更容易产生幻觉也在意料之中。在OpenAI内部用于衡量模型对人物知识准确性的PersonQA基准测试中,gpt-oss-120b和gpt-oss-20b分别对49%和53%的问题产生幻觉,达到o1模型的3倍多,也高于o4-mini模型的36%。
顺便一提,作为毫无惊喜的预告,奥尔特曼同时强调本周晚些时候会有一项“重大更新”。鉴于公司这段日子不断吊业界胃口的举动,市场普遍预期OpenAI下一个重磅更新将是推出GPT-5。
(文章来源:财联社)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

