AI大模型迭代放缓与商业数据双重考验

国内财经 2025-07-19 05:40:32 来源：中国经营网作者：网络

AI导读：

本文探讨了AI大模型迭代放缓的现象，指出从追求规模转向聚焦推理能力优化，同时分析了大模型企业面临的商业与数据双重考验，强调了持续现金流和顶尖科研人才的重要性。

　　通用大模型哪家强？当OpenAI新一代模型GPT-5迟迟未能面市时，Anthropic、xAI及国内的深度求索（Deepseek）、智源研究院、月之暗面等大模型厂商争相亮出最新版本。其中，埃隆·马斯克旗下的xAI最新推出的Grok 4基于自建的20万张英伟达H100 GPU计算集群，号称“全球最强的AI”。近日与Grok 4争夺“热门模型”桂冠的是月之暗面最新发布的Kimi K2开源模型。

　　从OpenRouter统计的近一年AI大模型市场份额看，OpenAI、谷歌、Meta等站稳前列。记者梳理发现，大模型主版本“代际”更迭速度和参数规模增长在明显放缓，但架构创新在加速，通过多智能体协同等手段快速提高推理效率。

　　快思慢想研究院院长田丰指出，受算力和数据瓶颈制约，大模型原先追求参数规模较为简单粗暴，但如今发展变慢，不过架构创新在加速。记者梳理统计了多个大模型的版本更新时间表，很容易看到OpenAI、Anthropic、Meta等大模型代际升级放缓，实际是从过去追求规模转向聚焦推理能力的优化。

　　迭代放缓or加速

　　记者梳理发现，OpenAI从发布基于GPT3.5的爆款产品ChatGPT，到发布GPT-4花费了约4个月，但GPT-5却一再“跳票”。Anthropic公司的Claude模型已于今年5月底更新至Claude 4。国产大模型厂商阿里云Qwen大模型的代际更新也在减缓速度。

　　主流大模型代际升级放缓背后，实际是从过去追求规模转向聚焦推理能力的优化。这种转变推动模型性能的进一步突破，也更贴合实际应用需求，代表了AI从量变到质变的进化趋势。

　　需要说明的是，xAI的迭代节奏有所不同。该公司分别于2023年10月、2024年8月、2025年2月和2025年7月陆续更新了四代Grok大模型。Grok4的训练依托20万张H100集群，计算资源是前一代Grok3的两倍。

　　从业界反馈来看，Grok4的一大技术亮点在于其Grok4 Heavy引入了“多智能协作机制”。深度科技研究院院长张孝荣指出，Grok是基于大算力推出的优化算法后的新版本大模型，在不少指标上获得了新突破。

　　两重考验：商业与数据

　　田丰认为，目前全球的大模型企业都面临商业考验和数据考验，这决定了企业要有源源不断的现金流。科技巨头围绕大模型的军备竞赛仍未休止，Meta首席执行官马克·扎克伯格表示正在投资数百亿美元用于AI研发与运营。

　　收购数据公司Scale AI无疑是Meta欲突破数据瓶颈的重要举措。事实上，xAI的Grok4与Meta兼顾商业化探索与技术性能提升的路径类似。马斯克认为，Grok4已在主要学科上超越博士水平。

　　在张孝荣看来，与国外大模型有所差异，国内的大模型竞争焦点已经从基础参数竞争转向了场景渗透力。据国家互联网信息办公室负责人介绍，目前国内已有433款大模型完成备案。

　　其中，月之暗面发布了最新的Kimi K2开源大模型，官方称Kimi K2的预训练阶段“实现了万亿参数模型的稳定高效训练”。记者注意到，自DeepSeek引爆国产大模型热潮以来，智谱AI、MiniMax、月之暗面等六家明星企业早已出现分化。

　　田丰指出，国内的AI初创型企业目前面临着商业化的考验与生存难题，在有限的算力、资金条件下，他们需要尽快推出优秀的AI爆款产品，找到新的商业模式。

（文章来源：中国经营网）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。