国内大模型创业公司春节前夕密集发布新模型,技术与用户取舍成焦点
AI导读:
春节前夕,国内大模型创业公司纷纷发布新模型,Deepseek和Kimi相继推出新模型对标OpenAI o1。面对大厂挑战,创业公司需要在技术迭代与用户规模之间做出艰难取舍。同时,多家公司也在积极招揽技术人才,为未来发展做好储备。
春节临近,国内大模型创业公司纷纷“抢滩登陆”,发布了多个与OpenAI o1相媲美的新模型,标志着国内AI技术竞赛进入新阶段。
自1月20日起,Deepseek与Kimi相继发布新模型,展现了国内大模型技术的迅猛发展。在Deepseek发布DeepSeek-R1后仅两小时,Kimi便推出了k1.5多模态思考模型,两者在数学、代码及多模态推理能力上均对标OpenAI o1正式版。


图片来源:微信截图
据Kimi官方透露,k1.5多模态思考模型在多项基准测试中表现出色,实现了SOTA级别的多模态推理和通用推理能力,成为OpenAI之外首个达到o1正式版水准的多模态推理模型。而DeepSeek-R1则通过强化学习技术,在极少标注数据的情况下,显著提升了模型推理能力。
面对这一波技术浪潮,以“AI六小龙”为代表的大模型创业公司面临严峻挑战。在人才、资金及耐心等资源的“重仓”投入下,创业公司需要在技术迭代与用户规模之间做出艰难取舍。
MiniMax创始人闫俊杰认为,用户数等指标并非AI竞争的核心,而将技术迭代视为最重要的目标。相比之下,Kimi创始人杨植麟则更看重用户留存,将提升用户留存视为Kimi当前最核心的任务。这一差异导致Kimi在公众讨论中多被提及C端用户体量优势,而Deepseek则因技术焦点而备受瞩目。
除了Deepseek和Kimi外,字节跳动旗下的豆包也推出了实时语音大模型,阶跃星辰则上线了Step-2系列语言模型的两款新品。这些新品在参数量、性价比及内容创作领域等方面各具特色,进一步加剧了大模型领域的竞争态势。
在技术和用户的双重压力下,大模型初创公司必须做出取舍。一些公司选择聚焦技术迭代,如零一万物将游戏、金融等方向的AI业务拆分进行独立运营和融资;而另一些公司则更注重用户规模的增长,如Kimi在C端用户争夺上持续发力。
然而,面对大厂的挑战时,大模型创业公司需要一定的“生存战略”。这些创业公司要么有产品上的差异化定位,要么有一个足够的时间窗口“往前跑”。因此,“取舍”和“聚焦”成为了国内多家大模型创业公司在2024年的战略关键词。
数据显示,截至2024年12月份,豆包、Kimi和文小言在AI原生App领域的“三强格局”已经形成。然而,豆包的持续扩张给Kimi带去了巨大压力。为了应对这一挑战,Kimi在发布k1.5模型的同时,也积极招揽技术人才,希望在人力物力上做好储备。
总体而言,国内大模型创业公司正面临前所未有的机遇与挑战。在技术和用户之间做出明智的取舍,将是决定这些公司未来走向的关键。
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

