Kimi K2 Thinking发布,AI市场技术迭代与竞争破局
AI导读:
月之暗面旗下Kimi大模型发布Kimi K2 Thinking,称其为能力最强的开源思考模型,在多项测试中表现卓越。当前AI市场技术迭代加快,Kimi面临市场认可挑战,正探索垂类合作等商业化路径,其能否建立不可替代性决定市场成效。
月之暗面今年以来的技术迭代还在继续,AI市场发展迅速。11月6日晚间,月之暗面旗下Kimi大模型发布了Kimi K2 Thinking,并称其为“Kimi迄今能力最强的开源思考模型”。Kimi官方表示,Kimi K2 Thinking是基于“模型即Agent(智能体)”理念训练的新一代Thinking Agent,它原生掌握“边思考,边使用工具”的能力,在多项基准测试中表现达到SOTA水平。
从实测成绩来看,Kimi K2 Thinking在“人类最后的考试”(Humanity's Last Exam)、自主网络浏览能力(BrowseComp)、复杂信息收集推理(SEAL-0)等多项基准测试中表现卓越。自7月进入“K2”版本之后,Kimi的升级正在提速。9月5日,Kimi发布Kimi K2模型的最新版本“0905”,进一步提升其在真实编程任务中的表现。9月25日,月之暗面Kimi发布全新Agent模式“OK Computer”并开启灰度测试。
据QuestMobile发布的2025年三季度AI应用行业报告,以头部互联网集团为例,今年1月—9月共完成182次模型发布/更新/迭代,平均每5.7天就迎来一次模型升级,模型迭代节奏持续加快,技术竞争正转向应用能力与推理深度的实战较量。在“人类最后的考试”中,Kimi K2 Thinking以44.9%的得分超越GPT-5(High)的41.7%,达到SOTA水平。面对信息过载的复杂搜索场景,Kimi K2 Thinking同样表现出色,BrowseComp测试中,人类平均得分仅为29.2%,而Kimi K2 Thinking以60.2%的成绩刷新了SOTA纪录。
目前,Kimi K2 Thinking模型的API(应用程序编程接口)已在Kimi开放平台正式上架,支持256K上下文长度,定价与Kimi K2-0905相同:每百万Token(大模型处理文本时的最小单位)输入收费4元,输出16元,若命中缓存,输入费用仅为1元。同时,平台也推出了生成速度高达100 Token/s的Turbo API,其每百万Token输入为8元,输出58元,命中缓存的输入同样为1元。然而,技术优势能否成功转化为市场认可,是摆在Kimi K2面前的首要挑战。QuestMobile数据显示,今年三季度,接近60%的原生App陷入负增长,对于新入局者或中小应用而言,独立打造一款成功的原生App的窗口正在收窄。
根据量子位智库10月数据,在AI助手APP新增下载榜上,Kimi与Deepseek分别以超420万和360万的下载量位列第三、四位,但相较9月,两者的下载量均下滑超过13%。与此同时,字节跳动的“豆包”以近2800万新增下载稳居第一,腾讯“元宝”则以超1300万下载、环比14%的涨幅位列第二。大厂凭借其生态优势,持续挤压着独立应用的生存空间。并且,更多跨界玩家正依托自身业务场景加速入局。在此背景下,今年以来的Kimi正尝试通过垂类合作探索商业化路径。今年“双11”期间,《每日经济新闻》记者测试发现Kimi更新了“导购”功能,可根据用户需求推荐商品并附带淘宝或京东链接,不过商品多来自代理店铺,尚未与官方旗舰店打通。
数据表明,具备清晰场景的垂直类AI应用仍具有增长潜力。据QuestMobile,字节跳动旗下即梦AI、豆包爱学及蚂蚁集团旗下AQ健康管家等垂类应用三季度月活跃用户规模复合增长率分别达12.1%、15.7%和83.4%。对Kimi而言,差异化的核心在于将模型能力转化为用户可感知的价值。其能否在Agent搜索、编程助手、深度研究等场景建立起不可替代性,将决定技术升级的市场成效。Kimi K2 Thinking展现出的技术纵深,为月之暗面在“思考型Agent”这一差异化路径上赢得了重要筹码。然而,在白热化的大模型竞争中,技术领先性只是入场券,能否将“长思考”“强推理”的模型能力,转化为用户高频依赖的应用场景,并构建起可持续的商业模式,才是真正的破局关键。
(图片来源:
Kimi网页版截图)(文章来源:每日经济新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

