AI推理大模型数学能力测评:DeepSeek-R1与腾讯混元T1并列榜首
《每日经济新闻》记者对DeepSeek-R1、腾讯混元T1等十款AI推理大模型进行了数学能力测评。结果显示,DeepSeek-R1与腾讯混元T1以零错误并列榜首,而马斯克旗下的Grok 3则排名倒数第三。此次测评旨在检验AI推理大模型在数学领域的实力,暴露了AI在某些题型上的局限性。...
《每日经济新闻》记者对DeepSeek-R1、腾讯混元T1等十款AI推理大模型进行了数学能力测评。结果显示,DeepSeek-R1与腾讯混元T1以零错误并列榜首,而马斯克旗下的Grok 3则排名倒数第三。此次测评旨在检验AI推理大模型在数学领域的实力,暴露了AI在某些题型上的局限性。...