智谱推出GLM-4.5V开源视觉推理模型 引领多模态AI新潮流
AI导读:
8月11日,智谱宣布推出全球100B级效果最佳的开源视觉推理模型GLM-4.5V,在多模态榜单中表现优异,兼顾精度、速度与成本,同步开源桌面助手应用,助力开发者打造多模态应用。
上证报中国证券网讯(记者孙小程)8月11日,智谱宣布推出全球100B级效果最佳的开源视觉推理模型GLM-4.5V(总参数106B,激活参数12B),并同步在魔搭社区与HuggingFace开源。
GLM-4.5V基于智谱新一代旗舰文本基座模型GLM-4.5-Air,延续GLM-4.1V-Thinking技术路线,在41个公开视觉多模态榜单中综合效果达到同级别开源模型SOTA性能,涵盖图像、视频、文档理解以及GUIAgent等常见任务。在多模态AI领域,GLM-4.5V展现了强大的实力。
在保持高精度的同时,GLM-4.5V兼顾推理速度与部署成本,为企业与开发者提供高性价比的多模态AI解决方案。API调用价格低至输入2元/Mtokens,输出6元/Mtokens。此外,其响应速度达到60-80tokens/s,满足了快速响应的需求。
为帮助开发者直观体验GLM-4.5V的模型能力,打造专属于自己的多模态应用,智谱同步开源了一款桌面助手应用。该桌面应用可实时截屏、录屏获取屏幕信息,并依托GLM-4.5V处理多种视觉推理任务,如代码辅助、视频内容分析等,极大地提升了开发效率。
(文章来源:上海证券报·中国证券网)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

