AI导读:

  AI行业热闹非凡。近日,DeepSeek、腾讯、小米等密集发布新模型,与此同时,人工智能的浪潮正从技术喧嚣,转向产业深处的务实探索。
  在北电数智近期举办的第二届酒仙桥论坛上,这一转变成为与会专家、产业人士关注的核

  AI行业热闹非凡。近日,DeepSeek、腾讯、小米等密集发布新模型,与此同时,人工智能的浪潮正从技术喧嚣,转向产业深处的务实探索。

  在北电数智近期举办的第二届酒仙桥论坛上,这一转变成为与会专家、产业人士关注的核心。不少人士指出,AI的焦点已从实验室的“炫技”全面走向产业端的“算账”,智能成本与工程化落地能力,将成为决定下一轮竞争格局的关键。

  “模型崇拜”已成过去式

  过去两年,参数规模和榜单能力一度被视为衡量大模型实力的重要标尺。但是当前,行业的关注点正在从“模型能力有多大”转向“技术落地有多稳”。

  “人工智能不是虚拟经济,而是关乎国计民生的实体产业。”北电数智首席技术官谢东指出,当前产业落地的核心堵点,在于传统架构无法适配AI时代的生产需求,“AI的产业落地不是单点技术的堆叠,而是一项需要全栈协同的复杂系统工程。”

  这一观点得到了中国工程院院士郑纬民的呼应。在他看来,随着人工智能迈入“智能体时代”,产业竞争的核心标准已经发生了根本性转变,从比拼算力集群规模,正在转向更加关注每瓦Token生产效率、服务稳定性和单位成本产出。

  所谓“每瓦Token生产效率”,本质上是衡量单位能耗下系统能够稳定输出多少有效Token,它不只取决于芯片算力,还取决于模型结构、显存利用、批处理策略、KV Cache管理、跨节点通信、调度系统和推理框架优化。

  郑纬民提出,行业正在从以模型调用为中心的MaaS,进一步走向以Token产能、Token成本和Token服务质量为核心计量对象的TaaS。模型仍是能力基础,但产业竞争的评价单位,正在从“模型参数与榜单能力”转向“单位成本下稳定生产高质量Token 的能力”。

  “未来,TaaS作为智能体时代生产智能的新型工业级服务体系,其目标是让智能生成能力像水电一样被稳定调度与供给。”他同时透露,我国Token消耗已从2024年的日均千亿级飙升至如今的日均140万亿级,但当前的算力基础设施主要服务于大模型训练,实际Token产能受限于系统优化不足,陷入高耗能、低产出等困局。

  这意味着,单纯堆砌芯片和算力已无法解决现实问题。谢东以北电数智的实践为例介绍,他们正在通过“数算模用”的全栈工程化创新,解决国产芯片从“能用”到“好用”的工程难题,以及模型部署、推理加速和规模化部署、工程化落地的问题。

  每一分成本都要算清楚

  随着智能体“龙虾”的爆火,巨大的成本消耗催生了“Token经济学”。

  Token是大模型处理文本与多模态信息的基本计量单元,既对应信息输入输出,也映射到底层算力、显存、时延和服务成本。无论是用户的一句提问,还是智能体执行的一次复杂任务,背后都转化为Token的实际消耗。

  北电数智CMO杨震拆解了一个更务实的商业逻辑。“现在大家关心的不是模型跑得多快,而是花同样的钱,能不能享受最稳定的服务。” 杨震谈到,针对Token生产的不稳定性,北电数智推出了系统级的推理优化方案。

  其核心逻辑是解决在高并发推理场景下,系统容易出现的请求排队、尾延迟升高、显存抖动、上下文重建、任务重试和服务降级等问题,确保在异构集群中,用户能获得高质量、无间断的API调用体验。

  杨震进一步解释称,异构算力调度和推理优化的难点,是“前进”和“宝塔”要解决的核心命题。“前进”把不同集群变成整体系统,从算力层、数据层到智能体层做到系统融合;“宝塔”是做系统级的推理适配,让单卡或多芯集群提供高质量的API调用,不会出现请求失败、响应超时、长队列等待、上下文中断、任务重试等问题。

  目前,AI行业已从早期技术探索阶段,进入规模化落地、体系化运营的深水区,企业和产业对AI成本可控、服务稳定、工程化落地的要求进一步放大,“算得清成本、跑得稳服务、落得透场景”成为行业刚需。谢东称:“AI不能只停留在模型层,必须进入真实世界的生产系统,形成可落地、可复制、可持续的能力体系。”

  未来,AI行业的核心竞争力不再是模型参数与算力堆砌,而是能否将算力、数据、模型转化为稳定、高效、可规模化的真实生产力,这也是人工智能从技术概念走向实体产业、赋能千行百业的必由之路。

(文章来源:21世纪经济报道)