AI导读:

2月18日,Grok3(Beta版)发布,性能超越DeepSeekV3、GPT-4o等竞品。Grok3凭借思维链推理能力解决复杂任务,训练成本预计达数亿美元,未来有望在医疗诊断、法律分析等场景应用。

2月21日,重要科技事件描述:

2月18日,Grok3(Beta版)震撼发布,并优先向X的PremiumPlus订阅用户开放,同时推出了每月30美元或每年300美元的SuperGrok订阅服务,订阅后可享受深度搜索等尖端功能,语音交互功能也将在一周后正式上线。

山西证券研究报告指出:

Grok3和Grok3mini在性能上全面超越或比肩Gemini、Deepseek和ChatGPT等竞品。官方测试数据显示,Grok3和Grok3mini在数学推理(AIME)、科学逻辑推理(GPQA)及代码写作(LCB)基准测试中,表现优于DeepSeekV3、GPT-4o、Gemini2Pro及Claude3.5Sonnet。特别是Grok3,性能较DeepSeekV3提升了27%-43%。在推理能力测试中,Grok3和Grok3mini再次刷新纪录,其中Grok3性能较DeepSeekR1提升了16%-22%。

凭借思维链推理能力的引入,Grok3在解决复杂任务上表现突出。在发布会上,Grok3成功完成了包括编码实现飞船3D动画、求解开普勒定律及创作新游戏等多个复杂任务。未来,Grok3有望在医疗诊断、法律分析等复杂推理场景中深度应用。

Grok3的总训练成本预计是DeepSeekV3模型的数倍乃至数百倍。xAI公司采用拥有20万个GPU的Colossus超级计算机进行训练,Grok3累计训练时长达2亿GPU小时。据vastai数据,GPU租赁价格约1-3美元每小时,因此Grok3的训练成本或达数亿美元,而DeepSeekV3的训练成本仅557.6万美元。Grok3的发布表明,预训练阶段的ScalingLaw仍在推动大模型进步,且大模型在算法层面仍有巨大提升空间。

(文章来源:财中社)