J9动态

火山引擎云端大模型日均调用量破百万亿TokensAI云竞争日趋激烈

发布时间：2026-03-26人气：

　　《晚点 LatePost》独家获悉，自今年春节以来，字节跳动云计算业务火山引擎的日均云端大模型调用量已超过 100 万亿 Tokens（词元），不到两个月上涨了超 60%。来自个人用户的 Token 消耗近期也明显增长。

　　据了解，全球目前只有三家公司的 Token 消耗量超过 100 万亿，分别是 OpenAI、Google 与字节跳动。不过字节跳动的 Token 消耗主要来自中国市场，海外市场则在快速增长阶段。

　　一位火山引擎人士告诉我们，火山目前的增长还是在一定约束条件下实现的——字节跳动旗下的视频生成模型 Seedance 2.0 API 尚未在海外正式上线。

　　Token 是 AI 理解和生成文本的最小语义处理单元，使用者每一次与大模型的交互（提问、生成的代码、生成的图片和视频等），最终都要被拆解成 Token 来完成运算。因此 Token 调用量成为了衡量 AI 模型活跃度、AI 企业算力承载力的关键指标。

　　过去一年里，Claude Code 等编程智能体（Agent）产品的走红让许多科技公司进一步意识到了 Token 的重要性——一次智能体任务往往包含多轮推理、工具调用和任务执行，Token 消耗通常显著高于普通 AI 对话。OpenClaw 则将 Agent 推向了更广泛的大众用户，进一步放大了 Token 的价值。

　　当地时间 3 月 16 日，英伟达创始人兼 CEO 黄仁勋在英伟达 GPU 技术大会（NVIDIA GTC）上称，Token 将是未来数字世界最核心、最值钱的大宗商品；Token 的相关指标（吞吐量、生成速度）将成为全球企业 CEO 追踪的核心经营数据，它的表现会直接反映在企业后续的收入中。

　　提供 MaaS（模型即服务）业务的云厂商是这一轮 Token 大爆发最大的受益者之一。它们通过出售模型调用服务、推理能力和配套工具获利；市场对 Token 需求的激增会直接推高它们的模型调用量，并带动收入增长。

　　2025 年起，围绕 Token 的 AI 云战争已经打响。亚马逊 AWS 管理层在 10 月的财报电话会议披露，长远来看，MaaS 的收入贡献将与 EC2（亚马逊 AWS 的 CPU 和 GPU 计算实例业务，总营收占比超过 30%）不相上下。

　　阿里云则在 11 月末启动了 “百炼战役”，目标是短期内将百炼（阿里云的 MaaS 平台）Token 调用规模提升三倍以上。今年 3 月 16 日，阿里巴巴成立了 Alibaba Token Hub 事业群，由集团 CEO 吴泳铭直接带队。

　　阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在接受我们的访谈时曾提到，过去取得了什么成绩并不重要，下一年增量的 10% 都会大于上一年的全量。2026 年，阿里云的目标是拿下中国 AI 云市场增量的 80%。

　　《晚点 LatePost》独家了解到，火山引擎此前曾定下了 2026 年 MaaS 业务收入超百亿元的目标，随着 Seed 2.0、Seedance 2.0 等模型发布、OpenClaw 持续爆火，团队已提升了收入目标。就在上一年，火山引擎也曾因这块业务增长迅猛，两度上调收入目标。

　　2022 年底，随着新一轮生成式 AI 浪潮卷起，云厂商迎来了一个新的机会：将大模型封装成可调用、可计费的云服务，卖给企业与开发者，并借此打开新的收入来源。

　　在早期，国内的几家头部云厂商中，只有火山引擎对于推进 MaaS 业务最为积极，也始终将 MaaS 放在了很高的战略位置。2024 年，火山引擎甚至调整了销售团队的业绩考核指标，把销售 MaaS 产品排在第一位。销售卖同等价格的 MaaS 产品得到的回报，要比卖传统云服务更高。

　　相比阿九游会（J9）里、华为与腾讯，字节在云计算上起步最晚，很难在传统的云服务上突围，新兴的 MaaS 业务因而成了它最有可能实现弯道超车的机会——先切入模型服务市场，进而拉动 IaaS、PaaS 以及上层应用服务的增长。

　　这在海外已有先例。比如对微软的云服务 Azure 来说，出售 OpenAI 模型的 API 只是第一步。客户一旦开始把大模型真正接进业务，往往就不只购买模型能力本身，还会继续采购检索、数据库、数据平台等配套云服务，这将直接提升他们在 Azure 上的整体支出。

　　推广 MaaS 业务也有助于字节的大模型能力迭代。一位火山引擎人士告诉我们，模型只有通过 MaaS 进入真实的 B 端场景，团队才能持续获得真实反馈，比如模型是否被用起来了、被用在什么场景、哪些地方做得好、哪些地方还不够好，并据此优化模型效果。

　　上述火山引擎人士透露，火山引擎很早就通过与客户开展协作计划意识到，B 端的企业客户会更多用 AI 来做长线程任务，有大量 Agentic Coding（智能体式编程）的需求，这在一定程度上反向推动了字节模型能力的演进。

　　许多传统的云厂商虽然也很早发布了自己的 MaaS 业务，但推进的节奏并不算快。部分原因在于，它们原有的收入和组织能力，仍主要建立在 CPU 时代的传统云计算生意上，包括 IaaS、数据库、存储、网络、安全以及各类企业软件服务。大模型带来的这套新需求，无论是底层算力结构，还是上层产品形态，都和过去很不一样。转型需要时间。

　　此外在国内大模型能力相对有限的阶段，全行业的 Token 消耗规模还不大且价格较低——百万 Tokens 在一元钱左右，这就导致 MaaS 业务的营收规模很小，不被市场所看好。

　　根据国际数据公司（IDC）公布的数据，2024 年中国整体公有云服务市场规模则超过了 3000 亿元，MaaS 市场规模仅为 7.1 亿元。

　　直到 2025 年初，MaaS 在中国终于迎来第一次显著提速。DeepSeek 的出现让大模型走出技术圈，进入更广泛的应用场景，越来越多企业和开发者开始通过云端调用模型。

　　另一个驱动力是多模态模型的成熟，生图、生视频的需求在快速增长。一位火山引擎人士回忆，字节的视频生成模型 Seedance 1.0 刚上线的时候，内部感觉它可能还不能很好地被使用在一些特别专业的创作上。但后来的实际情况是，有相当多的用户会用它来创作整部漫剧，这极大带动了火山引擎 Token 消耗量的增长。

　　国家数据局 2025 年 8 月数据显示，2024 年初中国日均 Token 消耗量为 1000 亿。截至 2025 年 6 月底，中国日均 Token 消耗量突破 30 万亿，一年半时间增长了 300 多倍。

　　《财经》曾报道，2025 年 12 月末，阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在一场小规模沟通中称，MaaS 收入在云厂商整体收入的占比，有可能达到 30% 甚至更高。

　　我们了解到，火山引擎在大模型领域的增长也在带动其传统云计算服务。目前火山引擎一定比例的 CPU 算力、数据库等需求来自大模型客户。

　　2025 年 5 月，Anthropic 推出的 Claude Code 在开发者群体与企业间流行了起来。它提供了一种全新的服务——让 AI 真正进入工作流，成为能读代码、调工具、跑任务的 Agent，从根本上改变了构建软件的方式。

　　Claude Code 等产品还带动了 Coding Plan 这类面向开发者的付费模式开始快速成型。它把原本按次、按量调用的 AI 编程能力，变成了可以高频使用的服务，进一步加快了 Agent 在开发者中的普及，并持续推高了 Token 消耗。

　　年底，OpenClaw 的出现又将 Agent 带入到了更广泛的大众群体中，Agent 也开始从 Coding 走向更广泛场景，包括搜索资料、处理邮件、撰写文档、安排日常事务。

　　2026 年初，Agent 风潮来到中国，硅谷此前经历过的一切又在这里重演了一遍。

　　最先受益的是几家 AI 创业公司。2 月，智谱将面向开发者的 GLM Coding Plan 价格上调至少 30%，直接原因便是开发者对 AI 编程工具的需求上升；长期聚焦 C 端产品的 MiniMax 也在其招股书和第一次财报中重点介绍了自己的 Coding Plan 模式。3 月 23 日，MiniMax 宣布将自己的 Coding Plan 升级为 Token Plan，成为了全球首个支持全模态模型的统一订阅计划。

　　国内的一众类 OpenClaw 涌现后，Agent 进入大众视野。一位火山引擎人士告诉我们，过去一个多月，来自个人用户的 Token 消耗增长了约 16 倍。

　　对企业来说，通过公有云调用（MaaS）是当前使用大模型最实用、也最有效的方式。企业真正需要的不是自己维护机器，而是按 Token 灵活调用模型能力；同时，大模型迭代极快、不同模型的最佳部署方式又各不相同，只有 MaaS 这类持续升级的平台，才能更快接入新模型，并把背后的部署、适配和运维复杂度一并接住。

　　继亚马逊 AWS、谷歌云年初释放涨价信号后，腾讯云、阿里云、百度智能云密集跟进，主流云计算服务商基本上全都加入涨价行列。

　　不过 Agent 时代对云厂商带来的挑战也不小。过去的云平台基本都是为 Web、App 场景服务的，现在则要转向围绕着 Agent 设计。

　　火山引擎智能算法负责人吴迪曾在火山引擎 FORCE 原动力大会上提到，下一代 Agent 应用绝不能只停留在探索层面，最终要真正走进企业的生产和业务需求里。这就要求 Agent 需要具备三大核心能力，长期记忆的能力，随业务数据变化的自我进化能力，以及准确执行多步骤复杂任务的能力。

　　对任何一家云厂商而言，这注定是一场艰难的攻坚战。“（MaaS）这个事还太早期了。” 火山引擎总裁谭待此前曾跟我们提到。他也会告诉团队 “马拉松才跑 500 米，别取得一点点小成绩就满意了。”

标签：火山弹追踪技术

上一篇：澳媒：我们总怨中国偷西方技术怎么我们就不能“偷”他们的呢？

下一篇：襄阳襄州区天气预报40天

九游会（J9）股份有限公司-官方网站

火山引擎云端大模型日均调用量破百万亿TokensAI云竞争日趋激烈

0411-84801941