AI导读:

DeepSeek模型热度持续飙升,京东云等六大云巨头及华为等国产芯片厂商纷纷接入,推动大模型低成本化,扩大AI垂直应用场景。DeepSeek的成功将提振云基础设施厂商和开源社区的发展。

随着Deepseek模型的热度持续飙升,其生态系统正以前所未有的速度扩展。近日,京东云宣布正式上线DeepSeek-R1和DeepSeek-V3模型,为用户提供公有云在线部署及专混私有化实例部署两种灵活选择。此前,阿里云、百度智能云、华为云、腾讯云、火山引擎以及天翼云等国内云巨头已纷纷接入DeepSeek模型,海外云巨头如亚马逊AWS、微软Azure亦宣布支持,进一步彰显了DeepSeek的广泛影响力。

同时,国产芯片厂商亦积极响应,华为宣布DeepSeek系列模型上线昇腾社区,沐曦GPU首发体验上线DeepSeek-V3满血版,天数智芯、摩尔线程、海光信息等亦在近日宣布支持DeepSeek模型。此外,英伟达、AMD、英特尔等海外芯片巨头亦早已完成支持,为DeepSeek的广泛应用奠定了坚实基础。

在AI基础设施领域,无问芯穹、基流动等厂商以及青云科技、PPIO派欧云、云轴科技等独立云厂商亦宣布适配及上架DeepSeek模型服务,进一步丰富了DeepSeek的生态系统。

DeepSeek朋友圈的迅速扩大,不仅有望推动大模型的低成本化,还将进一步扩大AI的垂直应用场景。目前,华为小艺助手App已上线DeepSeek-R1的Beta版,科创板上市公司光云科技、当虹软件等亦接入DeepSeek系列模型开展应用探索。

六大云巨头携手DeepSeek,共推开源生态发展

自DeepSeek旗下大模型火爆上线以来,国内主流云平台亦纷纷跟进,上线了相关模型。京东云言犀AI开发计算平台现已支持DeepSeek系列模型的一键部署,华为云与硅基流动亦联合首发上线了基于华为云昇腾云服务的DeepSeek推理服务。至此,国内六大云巨头均已正式支持DeepSeek,希望通过DeepSeek的火爆浪潮吸引更多客户使用其算力和服务。

据AI产品榜数据显示,DeepSeek上线仅18天时日活就突破1500万,增速远超ChatGPT。DeepSeek的成功不仅将提振云基础设施厂商的发展,还将激发整个开源社区的共建氛围,推动更多开源模型的快速进步。

OpenAI的闭源路线不同,DeepSeek选择了开源的开放路线。面对DeepSeek的火爆,OpenAI首席执行官萨姆·阿尔特曼亦承认OpenAI在开源策略上“站在了历史的错误一边”,并表示需要考虑制定不同的开源策略。

华泰证券指出,开源模型的优势在于社区共建和技术共享。2025年或将是开源模型快速进步的一年,国产大模型的进展亦值得期待。

国产芯片兼容支持,挑战与机遇并存

在芯片领域,DeepSeek系列模型已成功上线昇腾社区,并支持昇腾硬件平台上的开箱即用。摩尔线程亦宣布已实现对DeepSeek蒸馏模型推理服务的部署,并将开放自主设计的夸娥GPU智算集群,全面支持DeepSeek系列模型的分布式部署。此外,天数智芯、海光信息等亦已完成与DeepSeek模型的适配工作。

主流国产芯片已基本实现对DeepSeek蒸馏版小模型的兼容支持,这意味着只要此前能够运行类似Llama、Qwen等常见模型,如今便可直接无修改地运行DeepSeek蒸馏版小模型。然而,满血版的V3和R1对硬件的要求大幅提升,且需要额外的推理框架支持。目前,仅有少数几家国产芯片成功上线了满血版。

DeepSeek助力AI应用场景拓展

谈及DeepSeek对国内AI产业链的利好影响,沐曦联合创始人杨建表示,DeepSeek最大的影响在于强化学习的蒸馏流程开源,这将使大模型在垂直领域的后训练和推理成本急剧下降,可用性急剧上升。同时,DeepSeek的火爆也将催生大模型在各行各业的认知,拉升私有化垂直模型部署的愿望。

TrendForce集邦咨询指出,DeepSeek模型降低了AI训练成本,有望扩大应用场景,进而增加全球数据中心建置量。未来AI服务器之间的数据传输将需要大量高速光收发模块,这些模块的需求将持续增长。

随着DeepSeek带动模型成本的下降,AI应用有望迎来爆发期。科创板上市公司光云科技、当虹科技等均在探索DeepSeek模型的落地应用。同时,金山办公等知名企业亦在与DeepSeek进行对接测试,未来是否合作尚需观察。

在研究层面,杨建预计各大研究机构将加快新算法落地,今年将有更多算法创新爆发。在人才方面,杨建判断今年全国有望培养大模型应用开发人才30-50万,以满足行业快速发展的需求。