AI导读:

DeepSeek-R1以其低成本高性能的AI模型搅动AI江湖,引发广泛关注。同时,其开源举措也大大降低了AI使用门槛。面对DeepSeek的崛起,大厂与“六小虎”等创业代表纷纷调整策略,寻求应对之道。

Deepseek-R1推理模型上线不到一个月,已经搅得AI江湖“天翻地覆”。DeepSeek-R1凭借其API定价仅为OpenAI o1模型运行成本的3%,却能比肩OpenAI o1的性能,实现了低成本与高性能的完美结合。这一突破性进展,让AI界为之震动。

更引人注目的是,DeepSeek决定将R1模型完全开源。IDC中国副总裁周震刚指出,DeepSeek的开源举措极大地降低了高水平AI的使用门槛,将极大地推动人工智能的普及和落地。

这一趋势在过去的一个月里已经初现端倪。从上游的芯片、云服务商,到下游的应用,整个AI生态都在积极拥抱DeepSeek。C端市场,DeepSeek同样表现出色,据QuestMobile数据,2月1日,DeepSeek日活跃用户已突破3000万大关,创造了最快达到这一里程碑的纪录。

DeepSeek的崛起,无疑正在加速AI的普及以及AI应用生态的繁荣。然而,这也给其他大模型厂商带来了前所未有的挑战,他们该如何应对这一变局?

“六小虎”再寻路

在DeepSeek-V3发布之前,中国AI市场弥漫着悲观情绪。英伟达芯片的限供,让中国大模型厂商在算力层面受限,高昂的算力成本也让许多大厂倍感压力。

某头部大模型厂商高层曾直言,希望GPT5晚点发布,因为算力成本已经让他们难以承受。在规模法则放缓的背景下,追求更大规模模型的效率降低,许多企业担心成本投入无法获得相应的模型性能提升。

在此背景下,中国2023年的“百模大战”迅速降温,到了2024年,仍在坚持预训练模型的厂商已经寥寥无几。其中,“六小虎”——零一万物、百川智能、阶跃星辰、智谱AI、月之暗面、MiniMax等创业代表,也在调整策略。

零一万物率先表态不再追求超大模型,转而与阿里云合作成立产业大模型联合实验室,依赖大厂训练更大规模的模型来提升轻量化模型的性能。百川智能则聚焦于医疗模型和产品,其打造的“AI儿科医生”已在北京儿童医院上岗。

DeepSeek的出现,让“六小虎”的发展路径备受关注。李开复表示,当预训练结果已经不如开源模型时,每个公司都不应执着于预训练,尤其是创业公司,更应注重商业化。

随着模型性能的提升与推理成本的下降,2025年被视为中国大模型赛道的商业化拐点。对“六小虎”而言,今年的决胜点将是大模型能力的商业落地。

大厂仍会追求AGI

DeepSeek的崛起不仅冲击了“六小虎”,也让字节跳动、阿里巴巴和腾讯等大厂感受到了压力。DeepSeek的“初创+隐形大厂”打法,让市场看到了大厂之外的另一种可能。

DeepSeek的成功,激发了大厂的斗志。大厂们纷纷表示,将加大投入,探索新的技术路径,以应对DeepSeek的挑战。周震刚指出,DeepSeek的成功是工程化优化的结果,对其他有实力的大厂来说,未来充满了想象空间。

字节跳动CEO梁汝波在内部全员会上反思,DeepSeek R1的长链思考模式并非业界首创,但字节的跟进速度不够。对于2025年,梁汝波提出,字节跳动在AI业务上的目标是追求“智能”上限、探索新的交互和加强规模效应。

腾讯则率先全面拥抱DeepSeek,多款产品已接入DeepSeek-R1模型。腾讯表示,接入DeepSeek并不意味着放弃自研,而是通过赛马的方式倒逼自研模型的快速迭代,推动各产品加快场景建设。

对于未来大模型市场格局,浪潮信息高级副总裁刘军表示,未来大模型市场不会是单一垄断,而是多个模型并存。DeepSeek的开源打破了OpenAI的封闭垄断模式,激发了全球各个层面的创新活力。

(文章来源:21世纪经济报道)