AI导读:

国庆节前夕,DeepSeek与智谱发布新一代大模型,华为、寒武纪、海光等国产芯片厂商迅速完成适配,推动AI技术生态自主可控。DeepSeek-V3.2-Exp引入稀疏注意力架构,GLM-4.6成国内最强Coding模型,国产GPU性能与生态兼容性显著提升。



在国庆节前夕,Deepseek和智谱先后宣布推出新一代大模型,国产AI生态迎来关键突破。与此同时,国产芯片厂商都在第一时间宣布适配,这标志着国产GPU已具备与前沿大模型协同迭代的能力,加速构建自主可控的AI技术生态。尤其在AI芯片领域,这一进展为技术自主化提供了核心支撑。

9月29日,DeepSeek宣布开源DeepSeek-V3.2-Exp实验版模型,该模型首次引入了Attention稀疏注意力架构,并在几乎不影响模型输出效果的前提下,大幅度提升了长文本训练和推理效率,被DeepSeek定义为“迈向新一代架构的中间步骤”。这一架构突破为AI模型效率提升开辟了新路径。

华为、寒武纪、海光已经完成适配DeepSeek-V3.2-Exp实验版模型

在DeepSeek宣布后,算力芯片厂商华为、寒武纪(688256)、海光信息(688041)等AI芯片厂商已经宣布适配DeepSeek-V3.2-Exp。其中,华为通过昇腾设备实现128K长序列输出,TTFT(首token输出耗时)低于2秒、TPOT(每token输出耗时)低于30毫秒,推理性能达行业领先水平。

“华为计算”公众号发文宣布,昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp Day 0(第零天)支持,并面向开发者开源所有推理代码和算子实现。DeepSeek-V3.2-Exp在昇腾设备上的高效运行,验证了软硬件协同优化的可行性。

在DeepSeek-V3.2-Exp模型宣布开源几分钟内,寒武纪也发文称其已同步实现对该模型的Day 0适配,并开源大模型推理引擎vLLM-MLU源代码。寒武纪通过Triton算子开发和BangC融合算子技术,实现了极致性能优化,计算效率达业界领先水平。

寒武纪称,公司一直高度重视大模型软件生态建设,支持以DeepSeek为代表的所有主流开源大模型。借助于长期活跃的生态建设和技术积累,寒武纪得以快速实现对DeepSeek-V3.2-Exp这一全新实验性模型架构的day 0适配和优化,为长序列场景训推成本降低提供了技术保障。

海光信息也宣布其DCU实现无缝适配+深度调优,做到大模型算力“零等待”部署。基于GPGPU架构的生态优势,DeepSeek-V3.2-Exp在海光DCU上展现出高通用性和高兼容度,成为支撑AI大模型训练与推理的关键基础设施。

DeepSeek表示,得益于新模型服务成本的大幅降低,官方API价格也相应下调,开发者调用DeepSeek API的成本将降低50%以上。从价格来看,输入缓存命中从0.5元降至0.2元/百万tokens,缓存未命中从4元降至2元/百万tokens,输出由12元降至3元/百万tokens,进一步降低了AI开发门槛。

寒武纪和摩尔线程宣布适配智谱新一代大模型 GLM-4.6

9月30日,智谱正式发布并开源新一代大模型 GLM-4.6,在Agentic Coding等核心能力上实现大幅跃升。这是继DeepSeek-V3.2-Exp与Claude Sonnet 4.5之后,国庆节前业界的又一重大技术发布。GLM-4.6的代码生成能力已全面对齐Claude Sonnet 4,成为国内最强Coding模型。

智谱表示,在公开基准测试和真实编程任务中,GLM-4.6的代码生成能力已全面对齐Claude Sonnet 4,成为目前国内最强的Coding模型。同时,模型在长上下文处理、推理能力、信息检索、文本生成及智能体应用等方面均实现全面升级,整体性能超越DeepSeek-V3.2-Exp,为国产大模型全球化竞争奠定基础。

智谱官方宣布,GLM-4.6已在寒武纪领先的国产AI芯片上实现FP8+Int4混合量化推理部署,这也是首次在国产芯片上投产的FP8+Int4模型-芯片一体化解决方案。该方案在保持模型精度不变的前提下,大幅降低了推理成本,为国产芯片本地化运行大模型提供了可行路径。

与此同时,摩尔线程基于vLLM推理框架完成了对GLM-4.6的适配,新一代GPU可在原生FP8精度下稳定运行模型,充分验证了MUSA架构及全功能GPU在生态兼容性和快速适配能力方面的优势,推动了国产GPU生态的完善。

华为、寒武纪、摩尔线程等芯片厂商完成对新一代前沿大模型的适配,这标志着国产GPU已具备与前沿大模型协同迭代的能力,加速构建自主可控的AI技术生态。未来,国产原创大模型与芯片的深度协同,将持续推动AI基础设施的性能与效率优化。

截至30日收盘,寒武纪报收1325元,微涨0.11%;海光信息报收252.6元,跌1.27%。

(文章来源:澎湃新闻)