mt logoMyToken
ETH Gas
EN

Meta卖算力、Palantir骂街、智谱成硅谷顶流,AI Capex的故事要换一个讲法

Favoritecollect
Shareshare

AI 行情再次暴力回调,这次因为 Meta 说可能要把自己多出来的 AI 算力拿出去卖。

这个消息如果放在三年前,大概没人会觉得奇怪。云计算本来就是一门把服务器切碎再卖给别人的生意。亚马逊、微软、谷歌都这么干了很多年。CoreWeave、Nebius 这些新云厂商,也是在这条路上把英伟达芯片变成融资抵押物,再把融资变成更多芯片。

可偏偏轮到 Meta,事情就变了味道。

Meta 过去不是这样理解算力的。它买芯片、建数据中心、抢电力和土地,是为了自己的模型,为了广告系统,为了推荐流,为了扎克伯格嘴里那个越来越近的 superintelligence。它不是云厂商。它原来不靠把机器租给别人赚钱。

一家公司以前说,我需要尽可能多的机器,因为未来会吞掉它们。现在它说,如果这些机器暂时用不完,也可以卖给别人。

这不能直接说明算力过剩,但也不能轻轻放过去。

股市暴跌当天,Palantir CEO Alex Karp 在 CNBC 的采访节目上,对着镜头骂了将近二十分钟。

他本来是去聊 Palantir 和英伟达的新合作的,但话头很快转向了 OpenAI 和 Anthropic 的 token 收费模式。他说 CEO 们私下跟自己抱怨,现在企业的 AI 采用是「为不创造任何价值的 token 买单,还得把自己的数据交出去」。他甚至把越来越贵的模型账单,称为压在企业身上的财富税。

过去两年,大家讨论的是谁敢花、谁花得快、谁能先把数据中心堆起来。现在问题慢慢变了。机器买回来以后,谁能把它们一直跑满。

Meta 的说法还没有落地成正式业务。公开报道里,它内部有一个叫 Meta Compute 的方向,可能卖原始算力,也可能像亚马逊 Bedrock 那样,把不同模型放在自己的基础设施上卖给开发者。扎克伯格此前在股东会上讲过,外部公司几乎每周都来问,能不能买他们的 API 服务,或者买一部分 compute,而且愿意付高于 Meta 成本的价格。

他当时也补了一句。他们还没有这么做,因为 Meta 觉得自己还用得上这些算力。

如果用得上,出租是选择题。如果用不上,出租就是资产负债表的止疼药。

最难判断的地方也在这里。Meta 可能只是在建设节奏里腾出一段窗口,把暂时空出来的资源拿出去卖。它也可能是在告诉投资者,千亿美元级别的 AI 支出不能一直靠远方的 superintelligence 支撑,必须先找到一条更近的收入线。

这两种说法都能成立。

需求没有消失,只是开始挑人

Capex 是 AI 叙事的核心,没有之一,和 21 年的放水一样,Capex 的预期是一直增长,水一直放,市场炒的所有分支才会一起涨。一看到 Meta 准备卖算力,很多人第一反应是,AI capex 要塌了。大公司终于承认买多了,半导体的盛宴该散了。

这样说太省事。

公开数据还不支持这么干脆的结论。AWS 一季度收入涨了 28%,到了 376 亿美元,是这几年少见的快增长。Google Cloud 一季度涨得更猛,收入到了 200 亿美元。微软 Azure 也还在 40% 左右的速度上跑。

亚马逊还在说今年资本开支可能到 2000 亿美元,Alphabet 把 2026 年资本开支指引抬到 1800 亿到 1900 亿美元,Meta 自己也把全年资本开支抬到 1250 亿到 1450 亿美元。

这些数字不像一场需求崩塌。

更像一场分流。

云厂商的处境和模型厂商不一样。云厂商卖的是路。只要路上有人跑,无论车是谁造的,它都能收钱。OpenAI、Anthropic、企业客户、政府客户、创业公司,最后都要落在某一片数据中心、某一种芯片、某一条网络和某一个电力合同上。

所以三大云可以继续硬。

AWS 甚至在 6 月底提高了一个 AI 云服务的价格,是给客户提前锁 GPU 的服务,AWS 把这个服务 7 月开始的价格又上调了大约 20%。1 月它已经调过一次,大约 15%。这不是需求疲软时会出现的动作。

稀缺的时候,卖方涨价。

但模型公司不一定都能这么舒服。

模型公司的资产要更挑剔。算力不是放在那里就能产生收入。它要被更聪明的模型、更高频的用户、更贵的企业工作流不断填满。只有当模型足够好,用户才愿意忍受排队、限额、涨价和越来越复杂的订阅层级。

这也是为什么 Anthropic 会被市场看成另一类公司。它不是因为便宜,而是因为用户愿意把昂贵任务交给它。写代码、改系统、跑长任务、接企业工作流,这些任务一旦真的进入生产环境,消耗的 token 会比闲聊大得多。

强模型的麻烦是机器不够。

弱模型的麻烦是机器没人心疼。

这两个麻烦都叫算力,但它们不是同一种东西。

xAI 那条线也有同样的味道。Grok 没有像最强模型那样形成清晰的企业心智,马斯克体系里的一部分算力却可以流向 Anthropic。这个动作比任何口号都冷静。机器不认创始人,它只认谁能把它跑满。

Google 与 Meta 的关系也说明事情没那么简单。6 月有消息说,Google 限制了 Meta 对 Gemini 的使用,原因是 Meta 想买的算力超过了 Google 能提供的范围,甚至影响了 Meta 内部一些 AI 项目。一个公司一边考虑卖算力,一边又在某些任务上买不到足够的头部模型能力。

这不是传统意义上的过剩。

这是错配。因为账单开始变得刺眼。

云厂商可以继续涨价,因为它们卖的是确定性。客户要的是一段时间内一定能拿到的 GPU,一片稳定的数据中心,一套不会半夜断掉的基础设施。

但企业客户拿到算力以后,问题没有结束。

它们还要把这张账单交给 CFO。CFO 不会问你用了多少 token,他会问这些 token 替公司省了多少钱,多赚了多少钱,少犯了多少错。

到了企业那里,token 变成了电表

这就回到了开头 Karp 那场采访。

他把很多 AI 公司卖给企业的东西说成过度销售。上节目前一天,Palantir 还在 X 上发了一份九点声明,讲所谓 AI 主权,其中专门点了 tokenmaxxing 这种模式。这个词很难翻,直译出来难听,但意思并不复杂,就是把消耗 token 当成进步,把烧钱当成使用,把账单当成生产力。

Karp 把 OpenAI、Anthropic 这类前沿实验室推到了桌面上。他的意思不是企业不该用最强模型,而是企业不该把自己的数据、流程和业务判断都交出去,然后再按消耗量付一张越来越大的账单。

Palantir 想卖的是另一种东西。不是一个通用聊天框,不是单一 API,而是把数据、审批、权限、运营规则和 AI 放进同一套业务系统里。客户花钱买的不是「用了多少次 AI」,而是某条生产线、某套风控流程、某个政府任务有没有真的被改造。

企业里真正管钱的人已经开始醒了。

UBS 最近和企业 IT 高管聊下来,一个方向很清楚。很多企业不是不用 AI 了,而是在给 AI 花钱装刹车。大约 60% 的受访企业在压 token 开支、加使用护栏,尤其是那些已经过了试用期、开始把 AI 放进日常流程的公司。

这也是一个很有意思的反转。

AI 从玩具变成工具以后,花钱反而更难了。玩具阶段,老板愿意给预算,因为大家都怕错过。工具阶段,CFO 会问它替谁省了工时,替谁多卖了货,替谁降低了风险。

在这张表上,token 不像收入。

它更像电表。

你当然可以说,电表转得快说明工厂在开工。也可以说,电表转得太快而产量没上去,说明这台机器有问题。

AI agent 把这个问题放大了。OpenAI 和几所大学的一篇 Codex 研究里有一组数据很吓人。2026 年上半年,Codex 活跃用户增长超过五倍;OpenAI 内部一些岗位的输出 token 也暴涨,法律岗位的中位数月输出 token 比 2025 年 11 月高 13 倍,研究岗位高 50 多倍。

另一篇研究把事情说得更硬。agentic coding 任务消耗的 token,可以比普通代码聊天和代码推理高 1000 倍。同一个任务,不同运行之间的 token 消耗可能相差 30 倍。

这才是今天算力紧缺的底层。

不是大家多问了几句聊天机器人。

是软件开始变成一群会反复读文件、跑命令、改代码、失败、重来、再失败、再重来的小型工人。它们没有午饭时间,但每一步都在吃 token。

当 token 变成电表,谁拥有发电厂,谁就有权力。可谁把电浪费掉,谁也会先被审问。

账单一变厚,便宜模型就有了位置

CFO 一旦开始看这张电表,下一步几乎不用人教。

他会问,哪些任务必须用最强模型,哪些任务只需要够用的模型。

这时候,GLM、Kimi、DeepSeek、Qwen 这些开源模型就不再只是技术新闻。它们变成了企业采购桌上的砍价工具。

连硅谷顶级风投 a16z 的马克·安德森都说,很多 AI 从业者已经把智谱 GLM-5.2 看成第一批能在多数任务中匹配、甚至超过美国头部公开模型的中国模型。这个判断未必是最终裁判,但它让企业多了一句话。

Coinbase 给了更硬的例子。Brian Armstrong 说,公司把默认 AI 模型切到 GLM 5.2、Kimi 2.7 这类开源模型,再配合模型路由、缓存和精简上下文,Token 使用量还在指数级增长,AI 支出却砍掉了接近一半。

这句话的杀伤力在于,企业第一次可以把模型能力拆开采购。

最难的任务,继续交给最贵的模型。普通摘要、客服、信息抽取、模板化代码、内部知识库问答,交给便宜模型和本地部署。

开源模型未必要赢下全部战场。

它只要让采购部门相信,不是每一度电都要按豪宅电价付钱。

到了这里,Meta 卖算力就不再是一条孤立新闻。

它和 Palantir 骂 token、Coinbase 切开源模型说的是同一件事:AI 的支出链条开始被拆开。上游卖确定性,中游卖结果,下游压单价。每一层都还在增长,但每一层都开始被问,钱到底花得值不值。

最难的不是买机器,是让机器一直有活干

过去两年,AI 行业最容易讲的故事,是资源不够。

GPU 不够,电不够,数据中心不够,工程师不够,能把模型跑起来的云也不够。这个故事太顺了。只要东西不够,所有人都会本能地往前冲。先占位置,先签电力,先买芯片,先把机器架起来。

抢资源的时候,人不太会算细账。

因为慢一步的代价看起来更大。

但 Meta 这条消息把另一个问题推了出来。机器买回来以后,不会因为它贵,就自动变成好生意。它要每天有活干,要有客户愿意付钱,要有模型把它跑满,要有应用把成本转成收入。

这就是利用率。

利用率这个词听上去很冷,其实很残酷。它问的不是你有没有未来,而是你今天这台机器有没有开工。它不关心你在发布会上怎么说,也不关心你买的是不是最贵的 GPU。它只看一件事:这笔钱有没有变成持续的现金流。

云厂商回答这个问题相对容易。它们本来就卖基础设施。AWS、Google Cloud、Azure 卖的是路、电和机房。客户要训练模型,要跑推理,要托管应用,最后都要落在某一片云上。

所以它们还可以硬。

强模型公司也有自己的回答。如果模型足够强,用户愿意排队,企业愿意接入,开发者愿意围着它改工作流,那么算力不是库存,是瓶颈。机器越多,它越能跑得开。

最难的是中间那一层。

它们有机器,有故事,有模型团队,也有很大的预算。可是模型没有跑到最前面,产品没有变成日常习惯,开发者也不愿意为它改工作流。对这一类公司来说,算力从武器变成库存,只需要一次模型发布失败,或者一次用户迁移。

库存不一定没用。

但库存必须降价,必须出租,必须找新用途。

这就是 Meta 卖算力刺眼的地方。它不证明 Meta 失败,也不证明 AI 需求消失。它只是让市场第一次看见,AI 基础设施也会遇到普通工厂遇到的问题。

工厂建好了,订单在哪里。

算力没有消失,只是开始分层

所以这件事最好的理解,不是「算力过剩」。

这个词太粗。

更准确的说法是,算力开始分层。

最上面那一层,仍然紧。最强模型、最好的云、最稳定的 GPU 集群,还是有人抢。AWS 的服务能涨价,就是因为确定性本身有价格。客户不是只买 GPU,它买的是某一天、某一小时、某一批机器一定能用。

中间那一层,开始尴尬。它也许不差,但不够稀缺。它能跑模型,能做推理,也能卖给外部客户。只是客户会比较,会砍价,会问为什么不用更便宜的模型,为什么不用别人的云,为什么这批机器一定值这个价格。

最下面那一层,会被开源模型和成本优化一点点挤压。企业不会为了普通任务永远调用最贵模型。它们会做路由,会做缓存,会压上下文,会把模型拆成不同档位。

需求长大了。

小孩子花钱不看账单,成年人会看。AI 进入企业以后,也会经历这个过程。试点阶段,大家害怕错过;规模化阶段,大家开始算账。

算账以后,产业链就不会再像早期那样整齐。

有人继续涨价,因为他卖的是不可替代的确定性。有人改卖结果,因为客户不想为消耗本身付钱。有人被迫降价,因为够用的替代品出现了。有人把机器租出去,因为机器闲着比低价出租更难看。

这几件事同时发生,就会让行业看起来矛盾。

一边是算力紧缺。

一边是算力出租。

一边是 token 消耗暴涨。

一边是企业压低 AI 支出。

一边是头部模型越来越强。

一边是开源模型越来越便宜。

它们并不冲突。它们只是说明,AI 已经从一个总量故事,进入一个结构故事。

旧铁路的故事还会再讲一遍

十九世纪的铁路泡沫里,铁路不是假的。

铁轨铺下去,货物真的会走,城市真的会长,时间真的会被缩短。很多后来最有价值的商业网络,确实长在那些铁轨旁边。

可这不妨碍当年很多修铁路的人亏钱。

他们输的不是方向。他们输在修早了,修多了,修到了没有客货流的地方,或者借了太贵的钱去修一条太慢才能回本的路。

互联网泡沫里的光纤也是一样。光纤没有错。后来整个世界都被它托起来。错的是那一批账本,它们把未来几十年的需求一次性塞进了几年的资本开支里。

AI 数据中心可能也会留下很多有用的东西。GPU 会折旧,电力合同会续签,数据中心会换设备,软件会越来越会吃算力。今天看起来夸张的 token 消耗,几年后也许会像高清视频流量一样普通。

但资产有自己的脾气。

它不关心你信不信未来。它只关心每天有没有人来用。

Meta 卖算力的信号,就卡在这个地方。

它不是 AI 的终点。也不是半导体的终点。它更像资本开支叙事走到中段时,第一次有人把门打开,让外面的人看见仓库里有多少机器。

有些机器会被头部模型吃掉。

有些机器会被云客户租走。

有些机器会在价格战里变便宜。

还有些机器,会静静地等一个还没出现的应用。

过去两年,市场愿意相信所有机器最后都会等到自己的命运。现在它开始问,谁先等到,谁等不到,谁等到了也赚不到足够的钱。

这个问题一出来,AI 的故事就变了。

它不再只属于那些买机器最快的人。

它属于那些能让机器一直转下去的人。

Disclaimer: This article is copyrighted by the original author and does not represent MyToken’s views and positions. If you have any questions regarding content or copyright, please contact us.(www.mytokencap.com)contact
More exciting content is available on
X(https://x.com/MyTokencap)
or join the community to learn more:MyToken-English Telegram Group
https://t.me/mytokenGroup