mt logoMyToken
ETH Gas
简体中文

a16z:“开放式agent商业”与广告业务的终结

收藏collect
分享share

来源: a16z

编译:Felix, PANews

智能体商业(Agentic Commerce)时代已经到来。

OpenAI 的 AI 智能体电商协议(ACP)与Google 的通用电商协议(UCP)承诺在 ChatGPT 和 Gemini 中实现结账功能。很快,全球数亿消费者将找到更好的产品,商家的转化率将得到提升,而平台则能从中抽取 5-10% 的分成。

但是,ChatGPT 的结账功能只是一种渐进式的改进。它不会像 21 世纪初的互联网那样重塑社会,而开放式智能体商业则能做到这一点。

我们必须回到 20 世纪 90 年代才能理解其中的原因。

当时存在两种相互竞争的“互联网”版本。

  • 美国在线(AOL)版本:统一价格、邮件、天气预报、额外的审核内容,最终还包括整个时代华纳的内容库。

  • 开放协议:HTTP、DNS、HTML 和一款名为 Mosaic 的浏览器。

与 AOL 的版本相比,Mosaic 简直显得荒谬可笑。Mosaic 上的网站少得可怜,根本不需要搜索功能,一个按字母排序的索引就足够了。八年后,AOL 与时代华纳(Time Warner)以 3500 亿美元的价格达成平等合并协议。市场已经做出了选择:精选内容似乎才是未来的发展方向。

但没过多久,Mosaic 和开放协议就赢得了胜利,人类文明正式迈入了数字时代。为什么?试想一下,如果封闭的生态系统最终胜出会怎样?

2004 年,扎克伯格想创办 Facebook,他需要与 AOL 达成分发协议。斯坦福大学的两个学生想建立网络索引,他们需要获得 CompuServe 的许可。一个人想在自家车库里在线卖书,他需要向 MSN 的内容团队申请提案。

他们会这样说:“回去上学吧,小家伙们”。这些事一件都不会发生。我们习以为常的整个数字经济根本不会存在。

开放协议意味着没有“守门人”。任何拥有服务器和域名的人都可以访问整个互联网。边缘地区不断创新,中心地区却跟不上,最终成就了人类历史上规模最大的财富创造事件之一。这是资本主义的一项基本原则:创新源于边缘。

回到 1997 年:Tim Berners-Lee、Marc Andreessen 等人正在研究协议和浏览器。在当时,运行一台服务器需要花费数十万美元。内容服务器为何要响应陌生用户的请求,这一点并不明朗。这样做成本高昂,而且没有任何已知的经济激励。

他们创建了一个名为“402”的消息状态码,服务器可以将它发送给用户:“支付少量费用即可获取此内容。”但当时并没有合理的方式来进行数字支付。PayPal 尚未问世,而信用卡的固定手续费高达几十美分,对于 1 美分的小额交易来说实在太高了。

然而,互联网还是腾飞了。

谷歌为互联网找到了一种独特的商业模式:广告。在传统的媒体中,主要的经济关系存在于内容生产者和消费者之间。谷歌借鉴了广播的经济模式,引入了第三方:广告商。由他们来为内容生产者和消费者之间的关系付费。

此举非常巧妙。如今生产者可以将观众的注意力变现。他们不需要事先与消费者建立任何关系。谷歌则稳坐资金流中,夹在广告商和内容生产者之间,收取他们想要的任何比例的抽成。

因此,小额支付的需求被避开了。开源软件开始起步,云计算革命爆发,托管成本骤降百倍。谷歌成为了自由开放互联网的最大倡导者。消费者搜索得越多,谷歌赚的钱就越多。于是,他们投资了数千亿美元,让互联网变得快速、廉价且无处不在。

接着到了 2010 年代,一切似乎都没有改变。

利率低迷,技术发展缓慢,封闭的生态系统不断壮大。

2022 年,ChatGPT 上线,世界即将再次发生变革。大语言模型(LLMs)能做的不只是提供结果。它们还能生成并将许多这样的结果汇编成一个简洁明了的摘要,而且通常无需触及内容本身。

到了 GPT-4 出现时,情况已经很明朗:智能体就是下一步的发展方向:LLM 擅长像人类一样使用计算机,而且成本更低、效率更高。

就这样,互联网的经济格局发生了改变。

从 1997 年到 2024 年, 商业模式的核心是“分心营销”。 人类在阅读网页时很容易被广告分散注意力, 广告商会利用他们有限的注意力来牟利 。而低级智能体/智能体则不会分心。

这里面蕴含着一种奇妙的讽刺:广告创造了自由开放的互联网,而互联网又催生了拥有 10 万亿 Token 的大数据集,进而催生了 LLM,最终导致广告的衰落。

自 GPT-4 问世以来,Stack Overflow 的浏览量下降了 75%,科技新闻的流量下降了 60%。科技用户是早期采用者,但这股趋势最终将席卷网络上的所有信息。

ChatGPT 中的结账功能并不重要。互联网已成为文明的广场,而传统的经济契约早已过时。

互联网上有一些小区域成功抵御了谷歌的“侵蚀”,它们就像是拥有真正独特内容的“围墙花园”:Facebook、TikTok 和 LinkedIn。由于成千上万的高薪工程师夜以继日地工作,这些区域才得以抵御自动化机器人的抓取。

但是,围墙花园的防线也被攻破了。具备计算机使用能力的智能体能够完美模拟真实人类用户的流量。江湖骗子会在未来 10 年兜售各种“灵丹妙药”,沙丘路(PAnews 注:硅谷风投中心)的资本也会跟风投资。但实际上,根本没有灵丹妙药。堡垒的城墙已被战机摧毁。

下一步是什么?

开放式智能体商业。

ChatGPT 中的结账功能就像是智能体商业时代的 AOL。它是一个精选目录,一个用户体验更好的围墙花园。为了通过它进行销售,商家需要长达数月的商务拓展、严格的法律文件、具体的五年计划、可观的收入、强大的用户基础,以及一个能在登上《纽约时报》头版时让股东高兴的故事。

开放式智能体商业就像今天的 HTTP。它是一套简单的协议,让智能体能够为它们需要的任何东西付款。数据、云托管、通信,以及许多我们还未想象到的东西。

Coinbase 的 x402 和 Tempo 与 Stripe 合作推出的 MPP 是两大领先者。在“402”状态码发明 28 年后,我们终于拥有了一个可行的实现方案。现代区块链上的稳定币交易成本低于美分,解决了 1997 年导致小额支付失败的固定费用问题。

一个只能从预先批准的商家那里购买东西的智能体,就像是只能在三家供应商那里消费的公司信用卡的员工。而一个拥有开放协议的智能体,则像是一个拥有银行账户的企业家。

这里没有 BD,没有白名单,只有简单的无需许可的标准。

这些协议只关注两件事:

  • 智能体:“我该如何付款?”

  • 商家:“我如何确保智能体已付款?”

LLM 擅长调用它们从未见过的工具。从 Claude 4.5+ 和 Codex 5.2+ 模型开始,智能体无需事先训练即可发现 API、读取其模式并正确使用。

当前的讨论主要集中在“技能(skills)”上。你可以把它们想象成自然语言程序,可以像积木一样组合起来。一个非技术背景的创始人可以编写一条 Slack 消息,并让它像软件一样执行:

  • 从附近评价好的披萨店订购披萨,并每 10 分钟跟踪一次配送状态。

  • 当外卖员还有 5 分钟到达时,打开门廊灯。

  • 如果 30 分钟内送达,则给外卖员 5 美元小费。

无需编写代码,也无需计算机学位。智能体读取意图,及时编写一个计算机原生程序,执行它,然后将其丢弃。编程已没必要成为一门学科,掌握人类母语就足够了。

技能确实有效。但它们只是一种过渡性产物,是我们发现智能体可以调用不熟悉的工具后,最先想到的构建方式。它们需要有人编写、发布、进行安全检查和更新。而且智能体还需要预先加载它们。这很麻烦。

对技能的讨论掩盖了一个更深层次的突破:智能体可以以前所未有的方式组合各种能力。

买披萨只是个简单的例子。这里有个更真实的案例:一个管理小型企业供应链的智能体注意到,由于关税,包装供应商的价格上涨了 15%。它找到了三个本地替代方案,分别向每个供应商索取样品,协商批量价格,并最终完成切换。这一切都在企业主晨练之前完成。

无需 API 合作、采购团队或招标流程。只需要一个账户里有余额、且使用开放协议的智能体。

发现

智能体可以付款、可以组合能力,但还无法找到所需内容。

剩下的问题就是“发现”。对于智能体来说:“我怎样才能找到想买的东西?”对于商家来说:“我怎样向智能体介绍我的服务?”

AgentCash 应运而生。它是一个统一的账户,可以访问互联网上的所有 API。当智能体被屏蔽时,它可以访问数千个 API,花费极少的费用即可继续操作。

关键在于,AgentCash 将支付和商家发现功能整合在一起。商家可以在 x402scan.com 或 mppscan.com 上注册他们的服务器,并立即向所有 2000 多个 AgentCash 智能体展示他们的服务。

1997 年,互联网没有商业模式,没人知道服务器为什么要与陌生人通信。开放协议和一种名为“广告”的策略巧妙解决了这个问题,文明由此迈入了数字化时代。到了 2026 年,这种巧妙的策略正在消亡。开放协议和一种已有 28 年历史的状态码即将取而代之。

欢迎来到开放式智能体商业时代。

相关阅读: 一文读懂x402与MPP:Agent支付的两条路线

免责声明:本文版权归原作者所有,不代表MyToken(www.mytokencap.com)观点和立场;如有关于内容、版权等问题,请与我们联系。
相关阅读