AI大模型迭代放缓与商业数据双重考验
AI导读:
本文探讨了AI大模型迭代放缓的现象,指出从追求规模转向聚焦推理能力优化,同时分析了大模型企业面临的商业与数据双重考验,强调了持续现金流和顶尖科研人才的重要性。
通用大模型哪家强?当OpenAI新一代模型GPT-5迟迟未能面市时,Anthropic、xAI及国内的深度求索(Deepseek)、智源研究院、月之暗面等大模型厂商争相亮出最新版本。其中,埃隆·马斯克旗下的xAI最新推出的Grok 4基于自建的20万张英伟达H100 GPU计算集群,号称“全球最强的AI”。近日与Grok 4争夺“热门模型”桂冠的是月之暗面最新发布的Kimi K2开源模型。
从OpenRouter统计的近一年AI大模型市场份额看,OpenAI、谷歌、Meta等站稳前列。记者梳理发现,大模型主版本“代际”更迭速度和参数规模增长在明显放缓,但架构创新在加速,通过多智能体协同等手段快速提高推理效率。
快思慢想研究院院长田丰指出,受算力和数据瓶颈制约,大模型原先追求参数规模较为简单粗暴,但如今发展变慢,不过架构创新在加速。记者梳理统计了多个大模型的版本更新时间表,很容易看到OpenAI、Anthropic、Meta等大模型代际升级放缓,实际是从过去追求规模转向聚焦推理能力的优化。
迭代放缓or加速
记者梳理发现,OpenAI从发布基于GPT3.5的爆款产品ChatGPT,到发布GPT-4花费了约4个月,但GPT-5却一再“跳票”。Anthropic公司的Claude模型已于今年5月底更新至Claude 4。国产大模型厂商阿里云Qwen大模型的代际更新也在减缓速度。
主流大模型代际升级放缓背后,实际是从过去追求规模转向聚焦推理能力的优化。这种转变推动模型性能的进一步突破,也更贴合实际应用需求,代表了AI从量变到质变的进化趋势。
需要说明的是,xAI的迭代节奏有所不同。该公司分别于2023年10月、2024年8月、2025年2月和2025年7月陆续更新了四代Grok大模型。Grok4的训练依托20万张H100集群,计算资源是前一代Grok3的两倍。
从业界反馈来看,Grok4的一大技术亮点在于其Grok4 Heavy引入了“多智能协作机制”。深度科技研究院院长张孝荣指出,Grok是基于大算力推出的优化算法后的新版本大模型,在不少指标上获得了新突破。
两重考验:商业与数据
田丰认为,目前全球的大模型企业都面临商业考验和数据考验,这决定了企业要有源源不断的现金流。科技巨头围绕大模型的军备竞赛仍未休止,Meta首席执行官马克·扎克伯格表示正在投资数百亿美元用于AI研发与运营。
收购数据公司Scale AI无疑是Meta欲突破数据瓶颈的重要举措。事实上,xAI的Grok4与Meta兼顾商业化探索与技术性能提升的路径类似。马斯克认为,Grok4已在主要学科上超越博士水平。
在张孝荣看来,与国外大模型有所差异,国内的大模型竞争焦点已经从基础参数竞争转向了场景渗透力。据国家互联网信息办公室负责人介绍,目前国内已有433款大模型完成备案。
其中,月之暗面发布了最新的Kimi K2开源大模型,官方称Kimi K2的预训练阶段“实现了万亿参数模型的稳定高效训练”。记者注意到,自DeepSeek引爆国产大模型热潮以来,智谱AI、MiniMax、月之暗面等六家明星企业早已出现分化。
田丰指出,国内的AI初创型企业目前面临着商业化的考验与生存难题,在有限的算力、资金条件下,他们需要尽快推出优秀的AI爆款产品,找到新的商业模式。
(文章来源:中国经营网)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

