AI导读:

春节前夕,国内大模型创业公司纷纷发布新模型,Deepseek和Kimi相继推出新模型对标OpenAI o1。面对大厂挑战,创业公司需要在技术迭代与用户规模之间做出艰难取舍。同时,多家公司也在积极招揽技术人才,为未来发展做好储备。

春节临近,国内大模型创业公司纷纷“抢滩登陆”,发布了多个与OpenAI o1相媲美的新模型,标志着国内AI技术竞赛进入新阶段。

自1月20日起,Deepseek与Kimi相继发布新模型,展现了国内大模型技术的迅猛发展。在Deepseek发布DeepSeek-R1后仅两小时,Kimi便推出了k1.5多模态思考模型,两者在数学、代码及多模态推理能力上均对标OpenAI o1正式版。

图片来源:微信截图

据Kimi官方透露,k1.5多模态思考模型在多项基准测试中表现出色,实现了SOTA级别的多模态推理和通用推理能力,成为OpenAI之外首个达到o1正式版水准的多模态推理模型。而DeepSeek-R1则通过强化学习技术,在极少标注数据的情况下,显著提升了模型推理能力。

面对这一波技术浪潮,以“AI六小龙”为代表的大模型创业公司面临严峻挑战。在人才、资金及耐心等资源的“重仓”投入下,创业公司需要在技术迭代与用户规模之间做出艰难取舍。

MiniMax创始人闫俊杰认为,用户数等指标并非AI竞争的核心,而将技术迭代视为最重要的目标。相比之下,Kimi创始人杨植麟则更看重用户留存,将提升用户留存视为Kimi当前最核心的任务。这一差异导致Kimi在公众讨论中多被提及C端用户体量优势,而Deepseek则因技术焦点而备受瞩目。

除了Deepseek和Kimi外,字节跳动旗下的豆包也推出了实时语音大模型,阶跃星辰则上线了Step-2系列语言模型的两款新品。这些新品在参数量、性价比及内容创作领域等方面各具特色,进一步加剧了大模型领域的竞争态势。

在技术和用户的双重压力下,大模型初创公司必须做出取舍。一些公司选择聚焦技术迭代,如零一万物将游戏、金融等方向的AI业务拆分进行独立运营和融资;而另一些公司则更注重用户规模的增长,如Kimi在C端用户争夺上持续发力。

然而,面对大厂的挑战时,大模型创业公司需要一定的“生存战略”。这些创业公司要么有产品上的差异化定位,要么有一个足够的时间窗口“往前跑”。因此,“取舍”和“聚焦”成为了国内多家大模型创业公司在2024年的战略关键词。

数据显示,截至2024年12月份,豆包、Kimi和文小言在AI原生App领域的“三强格局”已经形成。然而,豆包的持续扩张给Kimi带去了巨大压力。为了应对这一挑战,Kimi在发布k1.5模型的同时,也积极招揽技术人才,希望在人力物力上做好储备。

总体而言,国内大模型创业公司正面临前所未有的机遇与挑战。在技术和用户之间做出明智的取舍,将是决定这些公司未来走向的关键。