Grok3震撼发布,性能超越ChatGPT
AI导读:
2月18日,Grok3(Beta版)发布,性能超越DeepSeekV3、GPT-4o等竞品。Grok3凭借思维链推理能力解决复杂任务,训练成本预计达数亿美元,未来有望在医疗诊断、法律分析等场景应用。
2月21日,重要科技事件描述:
2月18日,Grok3(Beta版)震撼发布,并优先向X的PremiumPlus订阅用户开放,同时推出了每月30美元或每年300美元的SuperGrok订阅服务,订阅后可享受深度搜索等尖端功能,语音交互功能也将在一周后正式上线。
山西证券研究报告指出:
Grok3和Grok3mini在性能上全面超越或比肩Gemini、Deepseek和ChatGPT等竞品。官方测试数据显示,Grok3和Grok3mini在数学推理(AIME)、科学逻辑推理(GPQA)及代码写作(LCB)基准测试中,表现优于DeepSeekV3、GPT-4o、Gemini2Pro及Claude3.5Sonnet。特别是Grok3,性能较DeepSeekV3提升了27%-43%。在推理能力测试中,Grok3和Grok3mini再次刷新纪录,其中Grok3性能较DeepSeekR1提升了16%-22%。
凭借思维链推理能力的引入,Grok3在解决复杂任务上表现突出。在发布会上,Grok3成功完成了包括编码实现飞船3D动画、求解开普勒定律及创作新游戏等多个复杂任务。未来,Grok3有望在医疗诊断、法律分析等复杂推理场景中深度应用。
Grok3的总训练成本预计是DeepSeekV3模型的数倍乃至数百倍。xAI公司采用拥有20万个GPU的Colossus超级计算机进行训练,Grok3累计训练时长达2亿GPU小时。据vastai数据,GPU租赁价格约1-3美元每小时,因此Grok3的训练成本或达数亿美元,而DeepSeekV3的训练成本仅557.6万美元。Grok3的发布表明,预训练阶段的ScalingLaw仍在推动大模型进步,且大模型在算法层面仍有巨大提升空间。
(文章来源:财中社)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

