AI导读:

2月18日,马斯克旗下xAI公司发布新一代大模型Grok 3,功能远超Grok2,超越ChatGPT等对手。推出Deepsearch智能搜索引擎,显示思考过程和网页验证,节省时间。Grok 3将向预定用户开放,面临GPT-4.5和谷歌新模型竞争,AI逻辑推理能力或升级。

2月18日午间,马斯克旗下xAI公司的新一代大模型Grok 3正式发布,吸引了超过100万人观看直播,马斯克本人亲自现身直播间。据马斯克介绍,Grok3在极短时间内实现了功能飞跃,远超Grok2,且在多方面性能上超越或媲美Gemini、Deepseek和ChatGPT等竞争对手。

xAI工程师透露,虽然Grok起步较晚,但在MMLU得分上迅速追上了ChatGPT。Grok 3的训练量是Grok 2的10倍,已在xAI内部运行两周。MMLU是评估语言模型语言理解能力的基准测试。此外,xAI推出了Deepsearch智能搜索引擎,作为Grok-3的配套工具,不仅帮助专业人士编写代码,还能解答日常问题。

马斯克现场演示了Grok 3的搜索能力,如预测星舰发射时间,显示模型思考过程和网页信息验证,最终以列表形式给出预测。Deepsearch的深度思考功能和次任务显示,比现有搜索引擎更强大,节省时间。马斯克表示,Grok 3将首先向预定用户开放,苹果应用商店版本会滞后,网页版更新最及时,语音模式或一周后推出。

直播末尾,马斯克和xAI工程师回答了网友提问,确认将开源Grok 3。谈及开发难点,马斯克表示是训练模型和逻辑推理过程。若Grok 3推理能力如视频中所示,或推动AI从生成答案向逻辑推导升级。xAI此前已推出多款大模型产品,但行业竞争激烈,GPT-4.5和谷歌新模型Gemini 2.0系列均已发布或进入测试阶段。

面对竞争对手,Grok 3能否占据主导地位尚需观察。同时,OpenAI等AI巨头感受到了来自中国大模型公司DeepSeek的冲击,OpenAI也有了进一步开源的迹象。马斯克在X上发起投票,询问用户希望下一个开源的大模型类型,或为开源预热。

(文章来源:界面新闻)