AI账单背后：Token两年暴增千倍与新货币战争

商业视界 2026-04-15 15:10:13 来源：南方都市报作者：网络

AI导读：

　　从技术单位到经济单位，从成本指标到估值标尺，Token正在成为智能时代的“结算货币”。它推动企业重新梳理组织、重构竞争逻辑，也迫使行业从补贴换市场的初级阶段，走向效率与价值驱动的深水区。
　　在这场刚刚开始的To

　　从技术单位到经济单位，从成本指标到估值标尺，Token正在成为智能时代的“结算货币”。它推动企业重新梳理组织、重构竞争逻辑，也迫使行业从补贴换市场的初级阶段，走向效率与价值驱动的深水区。

　　在这场刚刚开始的Token革命中，谁能以更低的成本、更高的效率，让AI真正转化为生产力，谁就能在下一个产业周期中掌握话语权。Token烧出的不仅是成本，更是AI价值落地的新战场——而这一切，才刚刚开始。

　　从即日起，南都推出“AI账单”专题，我们希望通过对B端及C端的100个真实案例的采访报道，以便了解AI账单背后的真实支出。

　　随着OpenClaw等“龙虾”类AI产品批量上线，全社会掀起一股“养虾”热潮，AI技术也开始从“能对话”迈向“能执行”，从而推动Token消耗量呈爆发式增长。国家数据局局长刘烈宏近日透露，到2026年3月，中国日均Token调用量已突破140万亿，相比2024年初的1000亿增长了1000多倍。

　　Token，这个被称为“AI时代的语言与货币”的计量单位，正以前所未有的速度重塑整个产业生态——从企业组织架构到商业模式，从估值逻辑到竞争叙事，一场由Token驱动的变革全面展开。行业的竞争焦点，已从“谁拥有性能更强、规模更大的模型”，转向了“谁能以更低的Token成本、更高的工具链效率，更有效地推动Agent的大规模落地”。

　　在这场Token热潮中，一道关乎成本与效能的现实考题也随之浮出水面：如何在众多模型中选出性能最优的解决方案？如何设计任务流程，才能最大限度地减少Token消耗？又该搭配怎样的配套服务，才能让每一枚Token发挥出最大价值？

　　Token：从技术单位到产业“货币”

　　今年3月，英伟达最先抛出了对Token的定义。英伟达CEO黄仁勋在GTC大会前明确将AI产业拆成五层：能源、芯片、基础设施、模型、应用。在他看来，Token是贯穿五层的统一计量单位，是现代生成式AI的基本单位，也是AI的语言和货币。

　　在英伟达GTC大会上，黄仁勋还描绘了一个未来图景：未来的数据中心将不再是存储文件的仓库，而是生产Token的“工厂”。他甚至预测，未来硅谷公司的招聘筹码中可能将“年度Token预算”纳入薪酬体系，其价值可能相当于基础薪资的一半，用以支持工程师实现10倍效率提升。也因此，黄仁勋还乐观地将2027年的业绩预期从去年的5000亿美元大幅上调至至少1万亿美元。

　　这并非空谈。Token消耗量飞涨，离不开龙虾产品的爆火。腾讯集团副总裁、政企业务总裁李强近期在接受南方都市报等媒体采访时提到，“龙虾”热潮带来了一个非常重要的分水岭，即大家对AI的认知从对话变成了可执行，而执行更容易让大家看到AI带来的真实价值。

　　探迹科技创始人兼CTO陈开冉告诉南都记者，Token热让探迹目睹了业务量的爆发。“以探迹B2C智能体为例，日均Token消耗已超500亿，年消耗突破10万亿，在B端Agent应用中位居前列。其实，Token消耗量本质上是AI‘真实工作量’的计量单位，处理的对话越多、解决的问题越复杂，消耗的Token就越多。”

　　业界对Token重要性的认识远早于大众。去年5月，Claude Code等编程智能体的推出，让AI成为能读代码、调工具、跑任务的Agent。AI变得能干后，一次智能体任务往往包括多轮推理、工具调用和结果输出等多步骤，Token消耗也远远高于此前大众更熟悉的AI对话工具。

　　这一情况下，厂商纷纷推出面向开发者或企业的Coding Plan，这种付费模式把原本按此调用付费的智能体使用能力变成了套餐打包服务，可以快速在开发者中普及，也拓展了Token消耗量。

　　全民“养虾”热后，龙虾类智能体再次推高了Token消耗量。人们惊奇地发现，AI不仅能干程序员那个代码世界的事情，也能干普通人办公生活中的琐事，比如做点日常新闻收集、帮忙收拾电脑桌面。与编程智能体一样，执行任务的“龙虾”明显需要消耗更多Token了。

　　自此，相对于编程时代的Coding Plan，国内大模型厂商正掀起一场Token Plan订阅服务争夺战。3月23日，大模型企业MiniMax宣布将此前的Coding Plan全面升级为Token Plan，即全球首个支持全模态模型的统一订阅计划。同日，阶跃星辰正式官宣推出月度token订阅方案Step Plan，设置4个不同档位方案：Flash Mini、Flash Plus、Flash Pro、Flash Max。起步价49 元/月，开发者社区限时半价低至25元/月。另外，腾讯、小米等厂商也逐步推出了专属Token Plan。

　　组织重构：大厂集体转向“Token中心化”

　　面对Token经济的崛起，国内互联网巨头也迅速调整阵型。近期，阿里巴巴围绕Token成立由阿里巴巴CEO吴泳铭负责的Alibaba Token Hub（ATH）事业群，包括通义实验室、MaaS业务线、千问事业部、悟空事业部及AI创新事业部共计5个事业部。

　　腾讯方面则在近期撤销了TEG（技术工程事业群）成立了十年的AI Lab，腾讯云在盈利后迅速推进商业化，比如在3月底腾讯CSIG（云与智慧产业事业群）成立云产品六部，由腾讯云CTO王慧星负责，推进系列智能体产品的能力建设与商业化。

　　几乎同时，腾讯还官宣升级其MaaS平台为TokenHub，用户可通过API统一调用混元、DeepSeek、MiniMax等主流大模型，配合Token Plan统一计费，实现多模型间的极低切换成本。腾讯集团高级执行副总裁汤道生坦言，这一变化的逻辑在于强化其全栈工程能力，“主流大模型能力差距正逐步缩小，企业比拼的不再是谁的模型更强，而是谁能通过工程化手段把模型用好”。

　　在这一轮组织升级中，阿里、腾讯、百度等云厂商纷纷将MaaS（模型即服务）提升至战略核心。MaaS是随着AI大模型兴起的一种新商业模式，它将模型调用、推理能力及相关工具打包成云服务，并通过标准化接口提供给企业用户，使其能够更便捷地使用AI能力。

　　国际权威市场调研机构英富曼（Omdia）去年9月发布《中国AI云市场，1H25》报告指出，2025年到2030年，中国AI云市场复合年增长率将达到26.8%，未来AI云的增长将由多Agents合作、上下文工程、AI安全、大规模API调用等驱动。其中MaaS层（AI模型服务）预计增长最快，复合年增长率将超72%，2030年将达177亿元规模。

　　而在这一轮Token热中，提供MaaS业务的云厂商、模型厂商无疑将成为最大受益者，并有信心在未来继续追高。在2026财年第三季度财报电话会上，阿里巴巴CEO吴泳铭立下目标——未来五年，包含MaaS在内的云和AI商业化年收入突破1000亿美元。他表示，今年一季度，百炼MaaS平台上公共模型服务市场的Token消耗规模提升了6倍，预计商业化MaaS收入将会成为阿里云最大收入产品。

　　有消息显示，火山引擎此前曾将2026年MaaS业务收入锚定超百亿元的目标，随着Seed 2.0、Seedance 2.0等模型发布、OpenClaw持续爆火，团队已提升了收入目标。

　　告别价格战：Token推动行业价值回归

　　在Token热的牵引下，除了组织架构的变动与商业目标的转向，相关服务的价格也开始调整。

　　今年以来，国产云厂商、模型厂商一改去年的价格战、补贴叙事，选择集体涨价。3月，腾讯云、阿里云、百度智能云三大头部厂商在一周内相继发布调价公告，上调AI算力服务及大模型相关产品价格。其中，腾讯云混元系列部分模型涨幅达463.13%，阿里云平头哥真武810E等算力卡产品涨价5%-34%，百度智能云AI算力相关服务上调5%-30%，多款此前免费公测的大模型同步结束红利期转入商用计费。

　　涨价的一大原因自然是Token调用量暴涨。此前有知情人士透露，“阿里云AI算力、存储等产品最高涨价34％，一大原因是Token调用量暴涨。春节期间，AI Agent应用爆发，阿里云MaaS业务百炼在今年1-3月创下了历史最高增速”。

　　有厂商选择一涨再涨，截至目前，智谱在今年已经涨价三轮，调价后，该公司旗下模型GLM-5.1在Coding场景的缓存命中Token价格已接近Anthropic旗下Claude Sonnet 4.6水平，这是国产大模型首次在核心场景实现与海外头部厂商的 “价格对齐”。API第三方调用平台OpenRouter数据显示，GLM-5.1的缓存命中价格为0.475美元/百万Token。而Claude Sonnet 4.6的缓存命中价格为0.3美元/百万Token。二者价格已较为接近。

　　然而，根据智谱上市后首份年度财报，截至今年3月，智谱的API调用价格较去年底提升了83%，依然供不应求。

　　对于涨价，智谱CEO张鹏在近期中关村论坛的一场圆桌上解释，干活消耗的Token量是简单问答的10倍甚至100倍，成本大幅提高。长期低价竞争不利于行业发展，调整价格是为了回归正常的商业价值。

　　Token飞涨也带动了成本结构的改变。4月9日，腾讯云对模型涨价后，再发布AI算力、容器服务、EMR相关产品价格调整公告，按他们的说法，鉴于全球AI算力需求持续激增，核心硬件供应链成本大幅上涨，为保障服务质量及算力资源的持续供给，腾讯云将于2026年5月9日起，对AI算力、容器服务及弹性MapReduce（EMR）相关产品刊例价进行上调5%的调整。

　　在腾讯2025第四季度及全年财报电话会上，腾讯管理层回应国内云计算市场涨价时还提到，CPU等基础设施的产能早已被预订一空，供应商通常会优先服务那些规模最大、订单最稳定的客户，但规模较小的企业和云服务提供商，不再相信自己能够稳定获得供应链支持，不得不转向超大规模的资源服务商。而超大规模的服务商一直以低利润率运营，当需求回升时，整个行业几乎别无选择，只能提高价格。

　　估值新叙事：Token成为企业价值标尺

　　每家企业都有自己的一套叙事逻辑，但Token不仅改变了成本结构，也在重构资本市场对AI的估值逻辑。作为计量单位，Token消耗量多少都会关系到企业的产品行不行、模型强不强。也因此，一场Token带来的价值排序、价值重估也在发生。

　　3月31日，OpenAI在完成最新一轮1220亿美元融资、投后估值达8520亿美元后披露，OpenAI旗下API目前每分钟处理量已突破150亿Token，以此计算OpenAI日均Token使用量为21.6万亿。

　　4月2日，字节跳动旗下火山引擎迅速在“AI创新巡展·武汉站”活动中宣布，截至2026年3月，其自研豆包大模型日均Token（词元）使用量位居中国第一、全球前三，仅次于OpenAI与谷歌。

　　南都记者关注到，除了字节以外，目前其他头部互联网厂商尚未公布Token消耗量。

　　火山引擎总裁谭待在采访中披露，去年底火山引擎的日均Token消耗是63万亿左右，三个月后现在已经到了120万亿，这样近一倍涨幅的背后，除了龙虾及类龙虾产品的普及以外，字节跳动多模态视频模型如Seedance 2、Seedream 5.0 lite的推出让视频创作相关Token消耗大幅增长。

　　在上市后首份财报中，智谱提出了“TAC时代”这一概念。智谱称，进入TAC时代，当大模型具备长程任务执行的闭环能力，核心竞争力将被重塑为TAC（Token Architecture Capability, 即Token架构能力）。

　　张鹏在财报电话会议上提到，现在AI能力已从可用、可玩走向真正解决越来越复杂和重要的问题，使Token的API调用和消耗真正转化为经济价值。TAC正在发生，比如Token经济、Token转化效率等，Token本身已经具备了经济价值和智能价值。他还提到，能有效替代人力、提高转化效率和智能水平的资源稀缺且宝贵，他相信定价权由智谱的技术实力以及长期趋势所带来的领先地位决定。

　　Token价格上涨，也带动智谱、MiniMax等模型公司的市值一度超越携程、快手、百度、京东等互联网大厂。Forrester副总裁兼首席分析师戴鲲告诉南都记者，模型公司的高估值主要反映市场对Token级基础生产要素的前置定价，而非对其当前收入规模的认可。如果此类公司无法建立稳定的调用场景和持续现金流，其估值仍将面临向应用与平台现实回归的压力。

　　行业竞争逻辑也正在变化。戴鲲认为，Token经济学时代，竞争逻辑正从 “谁拥有性能更优、规模更大的模型”，转变为 “谁能够凭借更低的Token成本、更高的工具链效率，有力支撑 Agent的规模化落地”。

　　他进一步表示，“模型在快速商品化。现在的差异化越来越依赖工具链完整性、生态黏性与应用/Agent 级复用效率。云厂商与模型厂商围绕 ModelOps工具链、开发者体验和生态控制力展开正面竞争。这一逻辑将一直持续，直到数据、模型、推理与 Agent 编排高度标准化，平台差异才可能弱化。”

　　行业逻辑变了，对大厂有何影响？戴鲲认为，这些影响对不同互联网厂商而言可以差异化地来看待。“对阿里、腾讯、百度、字节、京东等拥有云与模型能力的互联网大厂而言，Token经济一方面会强化其平台属性，但另一方面也会不断放大资本开支和效率压力。对美团、滴滴等偏传统业务企业，Agent将重塑用户访问方式，从‘人找服务’转向‘Agent代用户执行’，企业需要以战略视角重塑渠道、重构交易链路和进行成本优化。”

　　陈开冉认为，Token经济的背后，客户实际是在为智能体“完成任务的能力”付费。Token也正在从开发者的技术消耗品变成企业的规模化采购品类。“因此，行业竞争指标开始从‘流量’转向‘Token效率’。过去衡量互联网公司的核心是用户规模和时长，现在Token调用量正成为B端AI竞争的新风向标——大家比拼的是谁能用更少的Token消耗帮客户创造更大的业务价值。”

　　Token热潮之下：呼吁性价比与理性回归

　　Token狂热之下，理性声音也在浮现。

　　腾讯集团副总裁李强表示，目前Token确实是重要的管理指标之一，但腾讯内部并没有像友商一样把Token放在最高优先级。他将Token比喻成“油耗”，将大模型比喻成“引擎”，“这波Token热卖的原因是有一个”龙虾“这样的Agent出现，Token就假定是油耗一样，如果我们只关注油耗不关注引擎的经济性、引擎的输出能力，那客户最终也会舍弃。”

　　在他看来，厂商应该首先把精力放在“引擎”——大模型的研发上。在这方面，腾讯正在补课，但“补课的进度是比较快的”。南都记者关注到，混元3.0计划于4月陆续向外开放，目前已在内测阶段。

　　李强进一步提到，随着Token价格占比越来越高，Token的经济性很快会被所有客户关注到，那个时候如果只考虑消耗量不考虑经济性，用户完成一件事情的价格或成本会更高，这样也会对公司的长远健康发展带来负面的影响。

　　谭待也提到，关注Token价格的同时要结合Token的能力，就像买手机、芯片看单算力成本一样，抛开模型能力看价格毫无意义。他还提醒企业用户，大家应该真正关注“端到端完成事情的整体成本”，而非单Token成本，若单Token成本低，但用较差的模型需要消耗10倍甚至20倍Token还做不出结果，只会造成浪费。

　　尽管Token在当下带动各类服务涨价，但多位从业人士认为，未来Token相关服务价格会趋于平缓。腾讯云安全副总经理、AI Agent 安全中心负责人谢奕智对南都记者表示，从趋势来看，Token相关服务单价肯定是往下走的，因为它未来要成为水电那样普及的基础设施，有一定的规模。而针对Token消耗的焦虑，云厂商也在采取一定的措施，比如现在腾讯云上“龙虾”专业版已经植入对应管理功能，帮助了解Token消耗情况。

　　追求性价比的除了企业，还有个人。在“龙虾大战”中“薅”完各家厂商免费赠送的Token额度后，个人用户除了诉诸于上述针对个人开发者推出的Token Plan，也可能收到来自公司的Token赠送。

　　近期阿里巴巴集团在内部推进向员工提供Token额度，鼓励员工在工作中使用先进的AI模型与工具。根据该计划，阿里员工可免费使用悟空、Qoder系列等付费AI工具，用于技术研发和通用办公，公司将向员工提供Token额度。此外，员工购买百炼 Coding Plan会员或外部AI开发工具可以申请报销。另有消息称，腾讯给员工发“Token”福利，人均价值22万。

　　但Token的快速消耗，仍让不少人陷入焦虑。张鹏在一场对话中提到，龙虾让大家看到大模型能干活，但干活背后的Token消耗非常高，需要规划、尝试、Debug、处理模糊需求。

　　陈开冉则认为，大家关心Token消耗，是因为龙虾这类Agent让普通用户第一次深切感知到“智能是有成本的”。“Agent执行任务需要经历理解指令、规划拆解、调用工具、反思纠错等多个环节，每一步都在消耗Token，与上一代AI对话相比，Agent执行任务的Token消耗量级，跃升数十倍甚至上百倍，用户自然开始关心账单。”

　　“我们的资源需要支撑起这个快速增长的时代，现在的Token用量就像当年100兆手机流量的时代。我们需要更好的优化和整合，让每一个鲜活的人都能用起来。”无问芯穹联合创始人兼CEO夏立雪在一场圆桌对话中说。

　　陈开冉则表示，“Token经济账”是关乎B端服务商和客户双方的核心命题。“对客户而言，Token是成本，必须追求每一分投入的业务产出。对服务商而言，Token经济账直接决定了商业模式的可持续性，国家数据局已将其定位为”智能时代的结算单位“。算好Token账的本质，是让AI服务从”成本项“转变为可量化、可优化的”生产力投资“。”

（文章来源：南方都市报）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。