AI导读:

8月11日,智谱宣布推出全球100B级效果最佳的开源视觉推理模型GLM-4.5V,在多模态榜单中表现优异,兼顾精度、速度与成本,同步开源桌面助手应用,助力开发者打造多模态应用。

  上证报中国证券网讯(记者孙小程)8月11日,智谱宣布推出全球100B级效果最佳的开源视觉推理模型GLM-4.5V(总参数106B,激活参数12B),并同步在魔搭社区与HuggingFace开源。

  GLM-4.5V基于智谱新一代旗舰文本基座模型GLM-4.5-Air,延续GLM-4.1V-Thinking技术路线,在41个公开视觉多模态榜单中综合效果达到同级别开源模型SOTA性能,涵盖图像、视频、文档理解以及GUIAgent等常见任务。在多模态AI领域,GLM-4.5V展现了强大的实力。

  在保持高精度的同时,GLM-4.5V兼顾推理速度与部署成本,为企业与开发者提供高性价比的多模态AI解决方案。API调用价格低至输入2元/Mtokens,输出6元/Mtokens。此外,其响应速度达到60-80tokens/s,满足了快速响应的需求。

  为帮助开发者直观体验GLM-4.5V的模型能力,打造专属于自己的多模态应用,智谱同步开源了一款桌面助手应用。该桌面应用可实时截屏、录屏获取屏幕信息,并依托GLM-4.5V处理多种视觉推理任务,如代码辅助、视频内容分析等,极大地提升了开发效率。

(文章来源:上海证券报·中国证券网)