AI导读:

字节跳动发布豆包视觉理解模型,日均tokens使用量激增33倍,价格大幅降低85%,多模态定价迈入“厘时代”,再次震撼行业。

12月,字节跳动旗下火山引擎的豆包大模型再次展现强劲实力,日均tokens使用量突破4万亿,较5月发布时激增33倍,且价格仅为3厘/千tokens,相当于1元即可处理284张720P图片,降幅高达85%。

12月18日,在“2024火山引擎FORCE原动力大会·冬”上,字节跳动正式推出了豆包视觉理解模型,其卓越的性能升级与前所未有的低价策略,再次震撼了整个行业。火山引擎总裁谭待在发布会上强调,视觉对于人类及大模型而言,都是理解世界的关键。

豆包视觉理解模型不仅具备出色的内容识别、理解和推理能力,还能进行复杂的视觉描述和创作。此次价格的公布,标志着多模态模型价格正式迈入“厘时代”。

图片来源:每经记者杨昕怡摄

早在5月,豆包初次亮相便以比行业平均价格低99.3%的优惠引发了行业“降价潮”。此次多模态模型的“低价”策略,引发了外界对价格战的担忧。然而,抖音集团副总裁李亮12月19日在微博回应称,这并非价格战,而是豆包大模型通过技术创新降低成本的成果。

谭待在发布会上表示,豆包大模型在算法、软件工程和硬件方案上进行了大量优化,3厘/千tokens的定价依然能保证可观的毛利。他强调,目前大模型市场仍处于早期阶段,无需过分关注竞争,而应更多关注用户需求。

截至12月中旬,豆包通用模型的日均tokens使用量已超过4万亿,且豆包家族再添新成员——视觉理解模型。该模型能精准识别视觉内容,进行复杂逻辑计算,完成分析图表、处理代码、解答学科问题等任务,同时具备细腻的视觉描述和创作能力。

发布会上,谭待公布了豆包视觉理解模型的价格,标志着多模态定价正式迈入“厘时代”。同时,他展示了该模型在识别视频画面物体、解释天文图片、分析体检报告等方面的强大功能。

图片来源:每经记者杨昕怡摄

在B端市场,豆包大模型已与八成主流汽车品牌合作,并接入多家智能终端,覆盖约3亿台设备。此外,还有报道称苹果公司正与字节跳动商谈将豆包大模型整合到iPhone中,但字节跳动对此暂未回应。

谭待在会后接受采访时表示,豆包大模型在工程技术上进行了大量优化,有信心大规模、低价格、高吞吐地承接业界服务。同时,他指出大模型在B端和C端获客上不再割裂,而是齐头并进。

面对日益激烈的市场竞争,谭待表示,豆包将专注于提升自身能力、降低成本,以及方案的落地应用性,以满足企业和用户的实际需求。

图片来源:每经记者杨昕怡摄