当ChatGPT每天产生数十亿次交互,当AI Agent开始接管工作流,当视频生成模型每分钟消耗海量算力,产业界逐渐发现:对越来越多生成式AI场景而言,用户更关注最终获得的Token输出与结果价值,而非底层GPU资源本身。
于是,一个全新的产业概念开始浮现——Token Factory(Token工厂)。英伟达黄仁勋多次提出这个概念,其核心逻辑十分简单:未来的数据中心不再是存放文件的仓库,而是生产Token的工厂。Token将成为新的大宗商品,像石油、电力一样被定价、交易。
GPU是生产设备,电力是能源,数据是原材料,而Token则成为最终产品。这场认知转变看似只是概念更新,却意味着智算中心产业过去十年形成的商业逻辑正在被彻底改写。过去大家比拼的是“谁拥有更多GPU”,未来竞争的核心则变成“谁能生产更多、更便宜、更高质量的Token”。

01、从卖算力到卖Token:数据中心商业模式正在翻篇
过去几年,中国智算中心建设呈现出明显的“资源导向型”特征。地方政府建设智算中心,最常见的宣传内容是“拥有多少P算力”、“部署多少张GPU”、“投资金额达到多少亿元”。资本市场也习惯用GPU数量衡量项目价值,一万张GPU的数据中心似乎天然比五千张GPU的数据中心更有竞争力。
但问题在于,算力规模与商业价值之间从来不是线性关系。同样是一万张GPU,有的集群利用率不足三成,有的却长期处于满载状态;有的模型训练需要数月时间才能产出结果,有的系统却能持续高效输出商业价值。
GPU数量越来越像工厂里的机器数量。机器本身不创造价值,真正创造价值的是机器生产出来的产品。这正是Token工厂出现的根本原因。在AI时代,企业购买算力的目的不是拥有GPU,而是获得模型推理能力;用户使用大模型的目的也不是调用芯片,而是获取Token输出。
当产业链逐渐向终端价值回归时,Token开始成为新的计量单位。过去智算中心销售的是GPU时长,现在越来越多AI云厂商开始按照Token收费。过去关注GPU利用率,现在关注Token吞吐量。过去计算的是TFLOPS,如今计算的是每美元能够生产多少Token。
价值坐标系正在发生迁移。这种变化背后实际上隐藏着一个更深层次的问题:数据中心究竟是一种基础设施,还是一种生产设施?
传统IDC更像房地产生意,机柜出租和服务器托管,本质都是空间租赁;而Token 工厂更接近工业制造,其核心目标是提升生产效率、降低生产成本、提高产品质量。当数据中心被重新定义为Token工厂,其估值逻辑、运营逻辑乃至竞争逻辑都将发生根本变化。
02、智算中心的尽头,是一座超级Token工厂
如果把Token视为商品,那么智算中心正在经历一次工业化转型。过去的数据中心更像仓库,服务器摆进去即可。但今天的大模型训练集群越来越像高度自动化的生产车间。从GPU互联网络到高速交换机,从液冷系统到供电系统,从调度软件到推理框架,每一个环节都在影响Token产出效率。
这与传统制造业惊人相似。一家汽车工厂不会只统计拥有多少台机器,而会计算每小时能生产多少辆汽车。同样,一家Token工厂也不会只统计拥有多少GPU,而会关注单位时间能输出多少Token。
因此,未来智算中心之间的竞争将越来越像制造业竞争。谁的生产线效率更高,谁的运营成本更低,谁就拥有更大的利润空间。这意味着,产业竞争焦点开始从芯片采购转向系统工程能力。
过去行业讨论最多的是GPU型号,今天越来越多企业开始研究网络架构、散热技术、资源调度和推理优化。
原因很简单,GPU采购能力正在变成行业门槛,而Token生产效率才是真正的护城河。这也是为什么许多拥有大量GPU资源的企业并未形成领先优势,因为决定Token产量的因素远不止芯片。
网络堵塞会降低利用率;存储瓶颈会拖慢训练效率;推理框架设计不合理会导致资源浪费,这些因素共同决定最终的Token成本。
于是,一个有趣的现象正在出现:过去行业追求的是“堆GPU”,如今越来越多企业开始追求“榨GPU”。
如何让同样数量的GPU生产更多Token,正在成为智算中心运营的核心课题。从某种意义上说,智算产业正在从资源竞争进入效率竞争阶段,这恰恰是所有成熟工业体系都会经历的发展路径。
03、Token成为新货币,智算产业开始重新定价
如果说GPU是设备,那么Token正在变成AI时代的新货币。这种变化正在重塑整个产业链的定价体系。
过去云计算时代,计费单位是CPU小时、存储容量和带宽资源,用户购买的是基础设施。而在生成式AI时代,用户越来越关心结果。企业不会计算调用了多少张GPU,而是计算生成一份报告需要多少Token、训练一个Agent需要多少Token、生成一个视频需要多少Token。
因此,产业链价值正在向Token聚集。越来越多模型服务平台开始按照百万Token计费,越来越多开发者开始计算Token成本,越来越多投资机构开始用Token收入衡量AI企业价值,这实际上意味着一种新的经济体系正在形成。
在传统互联网时代,流量是核心资产;移动互联网时代,用户是核心资产;而在生成式AI时代,Token将成为重要的生产资料,所有AI服务最终都通过Token完成价值交付。
这种趋势甚至可能改变数据中心建设逻辑。过去建设智算中心首先考虑土地、电力和网络资源,未来则可能优先考虑Token需求分布,哪里拥有大量AI应用,哪里就会形成Token消费市场,而Token消费市场又将反向推动算力基础设施布局。未来智算中心与其说是能源基础设施,不如说是数字商品制造中心。
Token像电力一样被生产、传输、交易和消费,而围绕Token形成的新经济体系,也将成为AI时代的重要产业基础。问题在于,当所有人都开始追逐Token时,市场是否会出现新的泡沫?答案或许并不乐观。
04、Token工厂会不会重演“鬼数据中心”故事?
每一次基础设施革命都会经历“产能扩张”与“产能过剩”的循环。铁路时代如此,光伏时代如此,云计算时代如此,AI时代同样不会例外。
现如今,全球范围内都在建设智算中心,大量资本涌入GPU采购市场,地方政府竞相推出智算产业园,许多项目甚至在缺乏明确客户的情况下提前启动建设。这让人不禁想起过去几年频繁出现的“鬼数据中心”,一些项目拥有庞大的算力规模,却缺乏真实业务需求,最终形成大量闲置资源。
如果Token工厂成为新的产业风口,同样的风险依然存在。Token需求虽然增长迅猛,但增长速度未必能够长期匹配算力扩张速度,尤其是在模型效率持续提升的背景下,模型压缩、蒸馏、小模型推理和推理优化技术不断进步,单位Token所需算力正在下降。
这意味着,Token生产效率提升速度可能超过需求增长速度。一旦出现这种情况,Token价格将快速下跌,而依赖高资本开支建设的智算中心则可能面临盈利压力。
更值得关注的是,Token工厂天然具有规模效应,大型云厂商拥有海量用户流量,能够持续消化Token产能,而区域性智算中心往往缺乏稳定需求来源,最终可能陷入“有算力、无订单”的困境。
这也是为什么越来越多业内人士开始质疑:未来真正有价值的并不是Token生产能力,而是Token消费能力。谁掌握应用生态,谁才掌握最终定价权。
从这个角度看,Token工厂并不是简单的基础设施升级,而是一场关于产业控制权的重新分配。
05、从算力竞赛到价值竞赛:智算中心迎来终极考验
Token工厂最大的意义,不在于提出了一个新概念,而在于它重新定义了数据中心存在的价值。过去,行业讨论的是算力供给;未来,行业讨论的将是价值输出。过去,智算中心比拼的是GPU数量;而未来,比拼的将是收入规模、用户覆盖和高价值Token的产出能力。
这是两个完全不同的发展阶段,前者属于资源驱动时代,后者属于效率驱动时代。在资源驱动阶段,资本决定竞争力,谁投入更多资金,谁就拥有更多算力;而在效率驱动阶段,系统能力决定竞争力,谁能以更低成本生产Token,谁就能获得更高利润。
因此,未来智算中心竞争不只是芯片之争,更是软件、网络、能源、运营和生态的综合竞争。Token工厂正在把数据中心从基础设施行业推向制造业,而制造业的核心从来不是规模,而是效率。

对于中国智算产业而言,这或许也是一个重要转折点。过去几年行业最热衷讨论的是“建设多少算力”。未来几年更值得关注的问题可能是:“这些算力究竟生产了多少Token,又创造了多少价值?”真正决定产业未来的,从来不是工厂有多大,而是工厂生产出来的产品是否有人购买。
当Token成为AI时代的大宗商品时,智算中心的终极使命也将随之改变。它们不再只是存放GPU的机房,而是数字经济时代最重要的生产设施。而决定下一轮产业格局的,也不再是谁拥有最多GPU,而是谁拥有最高效、最赚钱的Token工厂。


