AI导读:

9月29日,DeepSeek-V3.2-Exp模型正式发布并开源,引入稀疏Attention架构提升效率。官方API价格下调,开发者成本降低超50%。DeepSeek频繁升级,展示中国AI领域竞争力。大模型训推带动AI算力需求,算力产业链环节有望受益。

  9月29日,Deepseek-V3.2-Exp模型正式在Hugging Face平台发布并开源,这一AI技术革新引发了广泛关注。DeepSeek宣布官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,展现了其在AI领域的强劲实力。据悉,模型引入稀疏 Attention 架构,这种架构能够降低计算资源消耗并提升模型推理效率,为AI发展注入新动力。目前,寒武纪、华为云已完成对 DeepSeek-V3.2-Exp模型的适配工作。

  DeepSeek介绍,得益于新模型服务成本的大幅降低,官方API价格也相应下调,新价格即刻生效。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上,进一步降低了AI开发的门槛。在AI技术浪潮中,DeepSeek频繁升级,就在9月22日晚,DeepSeek宣布,DeepSeek-V3.1已更新至DeepSeek-V3.1-Terminus版本。官方发布的测试结果显示,该版本模型单项提升幅度最大超过36%,展现了其持续创新的能力。

  而上述更新距V3.1发布仅一个月。8月21日,DeepSeek宣布发布DeepSeek-V3.1。当日,DeepSeek概念板块火热。随后,不少国产芯片产业链企业股价大涨,体现了市场对AI技术的热烈追捧。业内人士指出,在开源模型竞争趋于白热化的背景下,快速修复Bug、提升智能体能力将成为留住开发者的关键,DeepSeek正是这一趋势的引领者。

  国盛证券金融工程团队分析师张国安在研报中分析指出,DeepSeek具备高性能、低成本、蒸馏有效、开源等核心优势,同时DeepSeek提出多项算法创新,打破了海外算力堆砌的传统大模型提升路径,展示出中国在AI领域已经具备与全球顶尖水平竞争的实力。国海证券发布研报称,大模型训推带动AI算力需求增长,GB300、Vera Rubin等新一代算力架构将推出,算力产业链中的AI芯片、服务器整机、连接、HBM、液冷、光模块、IDC等环节有望持续受益,为AI产业带来新的发展机遇。

(文章来源:21世纪经济报道)