Token价格分化 豆包加速商业化
AI导读:
5月下旬,国内大模型市场呈现明显价格分化。通用模型依托技术优化持续下调Token调用价格,同质化赛道持续降价;主打高算力、复杂任务的高端模型逐步形成能力溢价。叠加字节豆包即将上线C端付费体系,行业正式形成通用降
5月下旬,国内大模型市场呈现明显价格分化。通用模型依托技术优化持续下调Token调用价格,同质化赛道持续降价;主打高算力、复杂任务的高端模型逐步形成能力溢价。叠加字节豆包即将上线C端付费体系,行业正式形成通用降价、高端溢价、终端分层付费的新格局。
近期通用模型降价动作密集落地。5月22日,DeepSeek宣布V4-Pro模型永久2.5折,整体降幅75%,百万Token输出价格为6元。5月27日,小米MiMo-V2.5系列调价,特定规格最高降幅99%,取消输入长度分级,统一全场景Token定价;5月30日,小米公开本轮降价的工程技术方案,说明本次降价核心依托技术优化实现降本。
与此同时,头部应用商业化付费体系加速落地,且走出了差异化的计费模式。5月初,豆包App Store页面出现付费版本服务声明。声明称,为更好地服务专业用户,豆包将在免费版的基础上,推出包含更多增值服务的付费版本。6月1日,知情人士透露,字节旗下豆包计划于6月下旬正式落地商业化付费体系,相关细则或将在火山引擎Force大会期间对外披露。
过去两年,国内大模型行业以发动Token价格战的方式争夺开发者与用户。进入2026年,行业定价逻辑重构:同质化通用模型价格持续下行,具备复杂推理、长文本处理、Agent运行能力的高端模型开始出现溢价,市场从单一低价竞争,转向分层定价的精细化竞争模式。
两轮降价周期,从补贴竞争到技术降本
行业先后经历两轮性质完全不同的降价周期。2024年上半年为第一轮降价周期,行业模型产品能力趋同,厂商主要依靠低价、免费额度、补贴吸引开发者,扩大生态规模。这一阶段的低价策略主要依靠企业资金与集团资源支撑,并非技术降本带来的成本下行。
2026年开启的第二轮降价,逻辑发生实质性转变。虽然仍有厂商依靠资源补贴维持低价,但主流厂商已通过模型架构、推理工程优化降低单Token成本,降价具备技术支撑,可持续性更强。
补贴式降价空间有限、依赖资金输血;技术降本可通过推理效率、算力利用率、缓存机制迭代持续优化成本,是当前行业核心降本路径。
市场供需分层是价格分化的核心原因。当前通用模型供给过剩,同质化竞争激烈,价格持续承压;适配复杂任务、行业定制场景的高端算力与模型供给偏紧。
瑞银证券分析师熊玮表示,高价值场景优质Token需求偏紧,头部客户复杂任务算力需求难以被充分满足。厂商单纯低价走量,不仅压缩利润,还可能影响服务稳定性。
需求结构变化进一步放大市场差异。企业端AI智能体落地,带动多步骤推理、工具调用、复杂任务场景增多,此类场景Token消耗远高于普通问答。熊玮判断,AI产业进入规模化落地阶段,市场Token整体需求将持续增长。
降本路径差异化,催生多元定价体系
价格分化的背后,是厂商推理效率与降本技术的路线差异。大模型推理成本高度依赖上下文缓存,在长对话、长文本场景下显存占用高、并发低、成本高。针对这一痛点,国内厂商形成两套差异化优化路径,也形成了不同的定价能力。
DeepSeek采用架构优化降本,V4系列通过MLA多头潜在注意力、MoE混合专家架构,优化显存占用、提升长文本场景并发能力,降低单次推理成本。
有分析师指出,国内厂商更侧重工程落地与成本控制,形成了模型价格下行快、性能差距可控的市场特征。
小米MiMo-V2.5主打缓存精细化治理,通过滑动窗口注意力机制筛选有效上下文,搭配全新缓存与调度策略,将线上前缀缓存命中率稳定至93%,减少重复算力损耗。这也是其取消输入长度分级、统一Token定价的技术基础,有效简化开发者计费成本。
与通用模型降价相反,高端复杂任务模型实现价格溢价。月之暗面Kimi主打长文本、复杂代码、Agent自主运行场景,K2.6版本强化复杂任务处理能力,可完成高时长、高复杂度连续任务,依托场景价值实现API价格小幅上调。月之暗面创始人杨植麟在2026年3月中关村论坛上公开表示:“在模型能力趋同的前提下,开源模式具备绝对优势。开源是和生态系统合作共赢,能让各方在Token规模增长中共同获益。”
豆包商业化路径与Kimi的B端溢价模式不同,以C端平台运营为核心,并未单一依赖B端Token售卖。本次付费落地,豆包采用的是行业通用的基础免费、增值订阅模式,脱离了纯按量计费逻辑。
具体来看,豆包基础功能免费开放,长文档解析、数据分析、AI视频生成等高算力功能,通过会员订阅收费,不按单次Token消耗计费。同时,豆包可联动抖音电商、本地生活、广告等字节生态业务,订阅收入仅为其商业化布局的一部分。
行业商业化迈入深水区,价值付费成共识
本轮价格分层与付费落地,标志着AI商业化逻辑切换。行业逐步告别传统流量变现,转向算力消耗、实际落地价值变现,Token按量计费、API服务、会员订阅成为主流商业化形态。
瑞银方锦聪认为,企业采购AI服务核心是为了降本提效,而非消耗流量。B端Token计费适配企业复杂算力需求,C端订阅匹配个人生产力需求,两类模式覆盖不同市场场景,拓宽了行业商业化空间。
目前行业商业化路径清晰,但规模化落地仍存阻碍。熊玮援引EvidenceLab调研数据指出,国内企业AI支出仅占整体IT预算的12%,核心制约并非预算不足,而是AI落地投入产出比难以量化。
该问题具备全球性共性。瑞银数据显示,78%的企业已进入AI实际部署阶段,但受限于场景适配、价值量化难题,Agent规模化落地仍需约1.7年的迭代周期。
随着价格战减弱、分层定价成型,大模型行业竞争进入新阶段。行业竞争不再依赖低价优势,厂商的场景落地能力、价值兑现能力与降本能力,将成为后续行业竞争与洗牌的核心依据。
(文章来源:21世纪经济报道)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

