国产芯片适配前沿大模型,AI技术生态加速自主化
AI导读:
国庆节前夕,DeepSeek与智谱发布新一代大模型,华为、寒武纪、海光等国产芯片厂商迅速完成适配,推动AI技术生态自主可控。DeepSeek-V3.2-Exp引入稀疏注意力架构,GLM-4.6成国内最强Coding模型,国产GPU性能与生态兼容性显著提升。
在国庆节前夕,Deepseek和智谱先后宣布推出新一代大模型,国产AI生态迎来关键突破。与此同时,国产芯片厂商都在第一时间宣布适配,这标志着国产GPU已具备与前沿大模型协同迭代的能力,加速构建自主可控的AI技术生态。尤其在AI芯片领域,这一进展为技术自主化提供了核心支撑。
9月29日,DeepSeek宣布开源DeepSeek-V3.2-Exp实验版模型,该模型首次引入了Attention稀疏注意力架构,并在几乎不影响模型输出效果的前提下,大幅度提升了长文本训练和推理效率,被DeepSeek定义为“迈向新一代架构的中间步骤”。这一架构突破为AI模型效率提升开辟了新路径。
华为、寒武纪、海光已经完成适配DeepSeek-V3.2-Exp实验版模型
在DeepSeek宣布后,算力芯片厂商华为、寒武纪(688256)、海光信息(688041)等AI芯片厂商已经宣布适配DeepSeek-V3.2-Exp。其中,华为通过昇腾设备实现128K长序列输出,TTFT(首token输出耗时)低于2秒、TPOT(每token输出耗时)低于30毫秒,推理性能达行业领先水平。
“华为计算”公众号发文宣布,昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp Day 0(第零天)支持,并面向开发者开源所有推理代码和算子实现。DeepSeek-V3.2-Exp在昇腾设备上的高效运行,验证了软硬件协同优化的可行性。
在DeepSeek-V3.2-Exp模型宣布开源几分钟内,寒武纪也发文称其已同步实现对该模型的Day 0适配,并开源大模型推理引擎vLLM-MLU源代码。寒武纪通过Triton算子开发和BangC融合算子技术,实现了极致性能优化,计算效率达业界领先水平。
寒武纪称,公司一直高度重视大模型软件生态建设,支持以DeepSeek为代表的所有主流开源大模型。借助于长期活跃的生态建设和技术积累,寒武纪得以快速实现对DeepSeek-V3.2-Exp这一全新实验性模型架构的day 0适配和优化,为长序列场景训推成本降低提供了技术保障。
海光信息也宣布其DCU实现无缝适配+深度调优,做到大模型算力“零等待”部署。基于GPGPU架构的生态优势,DeepSeek-V3.2-Exp在海光DCU上展现出高通用性和高兼容度,成为支撑AI大模型训练与推理的关键基础设施。
DeepSeek表示,得益于新模型服务成本的大幅降低,官方API价格也相应下调,开发者调用DeepSeek API的成本将降低50%以上。从价格来看,输入缓存命中从0.5元降至0.2元/百万tokens,缓存未命中从4元降至2元/百万tokens,输出由12元降至3元/百万tokens,进一步降低了AI开发门槛。
寒武纪和摩尔线程宣布适配智谱新一代大模型 GLM-4.6
9月30日,智谱正式发布并开源新一代大模型 GLM-4.6,在Agentic Coding等核心能力上实现大幅跃升。这是继DeepSeek-V3.2-Exp与Claude Sonnet 4.5之后,国庆节前业界的又一重大技术发布。GLM-4.6的代码生成能力已全面对齐Claude Sonnet 4,成为国内最强Coding模型。
智谱表示,在公开基准测试和真实编程任务中,GLM-4.6的代码生成能力已全面对齐Claude Sonnet 4,成为目前国内最强的Coding模型。同时,模型在长上下文处理、推理能力、信息检索、文本生成及智能体应用等方面均实现全面升级,整体性能超越DeepSeek-V3.2-Exp,为国产大模型全球化竞争奠定基础。
智谱官方宣布,GLM-4.6已在寒武纪领先的国产AI芯片上实现FP8+Int4混合量化推理部署,这也是首次在国产芯片上投产的FP8+Int4模型-芯片一体化解决方案。该方案在保持模型精度不变的前提下,大幅降低了推理成本,为国产芯片本地化运行大模型提供了可行路径。
与此同时,摩尔线程基于vLLM推理框架完成了对GLM-4.6的适配,新一代GPU可在原生FP8精度下稳定运行模型,充分验证了MUSA架构及全功能GPU在生态兼容性和快速适配能力方面的优势,推动了国产GPU生态的完善。
华为、寒武纪、摩尔线程等芯片厂商完成对新一代前沿大模型的适配,这标志着国产GPU已具备与前沿大模型协同迭代的能力,加速构建自主可控的AI技术生态。未来,国产原创大模型与芯片的深度协同,将持续推动AI基础设施的性能与效率优化。
截至30日收盘,寒武纪报收1325元,微涨0.11%;海光信息报收252.6元,跌1.27%。
(文章来源:澎湃新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

