AI导读:

阿里云宣布通义千问视觉理解模型全线降价超80%,Qwen-VL成为开源社区最受欢迎的多模态大模型,降价后1元钱可处理大量图片,同时推出全新KV Cache计费模式降低使用成本。

大模型价格战再次掀起波澜。12月18日,字节跳动旗下豆包视觉理解模型率先降价至0.003元/千Tokens后,阿里云紧随其后,于12月31日宣布通义千问视觉理解模型全线降价超80%,且降价立即生效!

这是阿里云在2024年内,继5月和9月两次降价后的第三轮大规模降价行动。Qwen-VL-Plus降幅高达81%,价格低至0.0015元/千tokens,创全网最低价;而高性能版本Qwen-VL-Max价格也降至0.003元/千tokens,降幅达85%。

根据阿里云此次降价后的最新价格计算,1元钱可以处理约600张720P图片或1700张480P图片,相比之前豆包大模型降价后的处理能力有显著提升,豆包大模型1元钱仅能处理284张720P的图片。

Qwen-VL作为开源社区最受欢迎的多模态大模型,以其强大的视觉推理能力著称,不仅能识别不同分辨率和长宽比的图片,还能理解20分钟以上长视频,同时具备自主操作手机和机器人的视觉智能体能力,可广泛应用于手机、汽车等终端视觉识别场景。

阿里云百炼相关负责人表示,此次降价得益于阿里云基础设施和模型结构的持续优化,以及大模型调用量指数型增长带来的规模效应,旨在第一时间将技术红利传递给所有用户。

在推理效率方面,阿里云构建了极致弹性的AI算力调度系统,结合百炼分布式推理加速引擎,大幅降低了模型推理成本,并加快了推理速度。2024年以来,Qwen-VL已成为百炼平台增长最快的模型。

此外,为进一步降低用户使用文本大模型API的成本,阿里云百炼还推出了全新的KV Cache计费模式,该模式通过自动缓存上下文避免重复计算,进一步降低了模型调用成本,特别适用于长文本、代码补全、多轮对话、特定文本摘要等场景。