AI导读:

9月30日,智谱宣布GLM-4.6上线,代码能力较GLM-4.5提升27%,在多个方面实现全面提升。该模型已在寒武纪国产芯片上实现部署,大幅降低推理成本,并与摩尔线程GPU兼容,即将通过智谱MaaS平台提供服务。

  9月30日,智谱宣布GLM系列最新版本GLM-4.6上线,其代码能力较上一版本GLM-4.5提升27%,展现了显著的技术进步。智谱表示,该模型在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面实现全面提升,成为技术领域的焦点。目前GLM-4.6已上线智谱MaaS平台bigmodel.cn,即将在Hugging Face、ModelScope开源,遵循MIT协议,为开发者提供更多便利。此外,在平均token消耗方面,该模型比GLM-4.5节省30%以上,进一步提升了资源利用效率。

  智谱介绍,GLM-4.6已在寒武纪国产芯片上实现FP8+Int4混合量化部署,在保持精度不变的前提下,大幅降低推理成本,为国产芯片在大模型本地化运行上开创了可行路径,彰显了国产技术的实力。此外,基于vLLM推理框架部署,摩尔线程新一代GPU可基于原生FP8精度稳定运行GLM-4.6,展示了强大的兼容性。GLM-4.6和寒武纪、摩尔线程国产芯片的组合,即将通过智谱MaaS平台正式面向大众和企业提供服务,预示着国产技术的新篇章。未来,国产原创GLM大模型与国产芯片将联合推动在模型训练和推理环节的性能与效率优化,共同促进技术发展。

(文章来源:中国证券报·中证金牛座)