Grok3震撼发布，性能超越ChatGPT

财经聚焦 2025-02-21 09:29:33 来源：财中社作者：网络

AI导读：

2月18日，Grok3（Beta版）发布，性能超越DeepSeekV3、GPT-4o等竞品。Grok3凭借思维链推理能力解决复杂任务，训练成本预计达数亿美元，未来有望在医疗诊断、法律分析等场景应用。

2月21日，重要科技事件描述：

2月18日，Grok3（Beta版）震撼发布，并优先向X的PremiumPlus订阅用户开放，同时推出了每月30美元或每年300美元的SuperGrok订阅服务，订阅后可享受深度搜索等尖端功能，语音交互功能也将在一周后正式上线。

山西证券研究报告指出：

Grok3和Grok3mini在性能上全面超越或比肩Gemini、Deepseek和ChatGPT等竞品。官方测试数据显示，Grok3和Grok3mini在数学推理（AIME）、科学逻辑推理（GPQA）及代码写作（LCB）基准测试中，表现优于DeepSeekV3、GPT-4o、Gemini2Pro及Claude3.5Sonnet。特别是Grok3，性能较DeepSeekV3提升了27%-43%。在推理能力测试中，Grok3和Grok3mini再次刷新纪录，其中Grok3性能较DeepSeekR1提升了16%-22%。

凭借思维链推理能力的引入，Grok3在解决复杂任务上表现突出。在发布会上，Grok3成功完成了包括编码实现飞船3D动画、求解开普勒定律及创作新游戏等多个复杂任务。未来，Grok3有望在医疗诊断、法律分析等复杂推理场景中深度应用。

Grok3的总训练成本预计是DeepSeekV3模型的数倍乃至数百倍。xAI公司采用拥有20万个GPU的Colossus超级计算机进行训练，Grok3累计训练时长达2亿GPU小时。据vastai数据，GPU租赁价格约1-3美元每小时，因此Grok3的训练成本或达数亿美元，而DeepSeekV3的训练成本仅557.6万美元。Grok3的发布表明，预训练阶段的ScalingLaw仍在推动大模型进步，且大模型在算法层面仍有巨大提升空间。

（文章来源：财中社）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。