mt logoMyToken
ETH Gas
EN

从“地址聚类”到“证据标准”:Chainalysis为何要重新定义区块链追踪?

Favoritecollect
Shareshare

作者:137Labs

2026年6月底,Chainalysis 对外公布了一套名为《Blockchain Tracing Ontology(区块链追踪本体)》的数据框架,希望为区块链分析建立更加统一的数据描述体系。相比过去发布的新产品或新功能,这份文件更像是一项行业标准倡议:它试图重新定义链上数据分析的基本概念,并为区块链追踪建立一套可解释、可验证、可复现的数据模型。

这份提案发布后,很快成为区块链分析和数字资产合规领域关注的话题。尽管目前仍属于公开讨论和行业倡议阶段,但它已经让人们开始重新思考:链上分析是否需要一套更加统一、透明的数据标准。

一个长期存在的问题:不同公司为何会得出不同的分析结果?

区块链数据天然公开透明,但如何解释这些数据,却一直缺乏统一标准。

目前,大多数链上分析平台都会使用“地址聚类(Address Clustering)”技术,通过交易行为推断哪些地址可能由同一主体控制。然而,不同机构采用的算法、规则和证据来源并不一致,因此同一地址在不同平台可能对应完全不同的归属结果。

例如,一家分析机构可能认为某地址属于某大型交易所,而另一家机构则将其标记为未知钱包;同一批地址,在不同平台中也可能被划分到不同的 Cluster。这种差异对于市场分析影响有限,但一旦涉及司法调查、资产冻结、反洗钱或执法取证,就可能带来较大的争议。

对于法院而言,仅仅给出“这是某交易所的钱包”这样的结论远远不够,更重要的是回答另一个问题: 为什么可以得出这样的判断?

Chainalysis提出的不是新算法,而是一套“语言”

很多人看到“Ontology(本体)”这个词,容易误以为 Chainalysis 又提出了一种新的聚类算法。实际上并非如此。

Ontology 是知识工程领域的概念,指的是一套统一的概念体系和关系模型,用来规范不同对象之间的定义及其关联方式。互联网搜索、医学知识库乃至人工智能知识图谱,都大量使用 Ontology 来保证数据能够被统一理解。

Chainalysis 希望做的,是为区块链分析建立类似的“共同语言”。

换句话说,它并不是规定所有公司必须采用相同的聚类算法,而是希望大家能够按照统一的数据结构来表达分析结果,让分析过程更加透明,也便于第三方理解、验证和复现。

“Cluster”已经不够用了

过去,行业普遍采用“Cluster(地址簇)”作为分析的基本单位,即认为多个地址共同属于一个钱包或一个实体。

这种方法虽然简单直观,但随着区块链基础设施的发展,其局限性越来越明显。

如今,一个大型交易所的钱包体系可能包含数百万个地址,不同地址承担着充值、提现、冷热钱包管理、归集、找零等完全不同的功能。如果仍然简单地把它们全部归为一个 Cluster,就难以准确描述复杂的钱包结构。

因此,Chainalysis 在提案中提出了“Wallet Segment(钱包片段)”这一新的概念。

在新的模型中,一个实体(Entity)可以拥有多个钱包(Wallet),每个钱包又可以划分为多个 Wallet Segment,而每个 Segment 下才包含具体地址。这种分层结构比传统的 Cluster 更能真实反映大型机构的钱包管理模式,也能够更细致地描述不同地址之间的控制关系。

从“结果可信”走向“过程可信”

相比模型本身,更重要的变化来自第二层设计。

传统的链上分析,更多关注的是最终结果——地址属于谁、资金流向哪里、是否涉及非法活动。

而新的 Ontology 更强调推断过程本身。

对于每一项分析结果,都应该明确回答几个问题:

  • 这一结论依据哪些链上证据?
  • 使用了哪些分析规则?
  • 是否引用了链下信息?
  • 这一推断的可信度是多少?
  • 第三方是否能够重新验证这一过程?

换句话说,不仅要告诉别人“是什么”,更要解释“为什么”。

Chainalysis 将这一部分称为 Evidence(证据)与 Confidence(可信度)层。

未来,一个地址被标记为交易所钱包,不再只是一个简单标签,而会伴随完整的推断依据,包括交易模式、地址关系、公开信息、调查记录等,并给出对应的可信度等级。这种设计更符合司法证据对于可解释性的要求,也有助于不同机构之间开展交叉验证。

Bitcoin Fog案件带来的启示

事实上,这份提案并非凭空产生,而是与美国著名的 Bitcoin Fog 洗钱案件密切相关。

Bitcoin Fog 曾是比特币历史上持续时间最长的混币服务之一。美国司法部在调查过程中大量采用了 Chainalysis Reactor 的分析结果作为关键证据。

案件审理期间,法院举行了著名的 Daubert 听证会,对 Chainalysis 的分析方法进行了严格审查,包括:

  • 地址聚类是否具有科学依据;
  • 分析方法是否能够重复验证;
  • 是否属于不可解释的“黑盒算法”;
  • 其他专家是否能够独立复现分析过程。

最终,法院认可了 Chainalysis 的分析方法具有足够的科学可靠性,可以作为司法证据使用。

不过,这一案件也暴露出整个行业存在的问题:如果不同分析机构采用不同标准,未来类似案件可能面临更多质疑。因此,建立统一的数据表达和证据框架,成为 Chainalysis 推动 Ontology 的重要背景。

区块链分析不能直接识别真实身份

值得注意的是,Chainalysis 在此次提案中特别强调了一点:链上分析本身无法直接识别现实世界中的个人身份。

链上数据只能揭示地址之间的关系和资金流动路径,至于地址背后的真实控制者,通常仍需依赖链下证据,例如交易所 KYC 信息、法院调取的数据、执法机关获取的服务器日志等。

这意味着,区块链分析提供的是一种高质量的数据推断,而不是直接证明身份的最终证据。真正完整的司法证据链,需要链上数据与链下调查相结合。

从数据质量走向行业标准

除了 Ontology 本身,这次提出的整体框架还围绕数据质量、分析透明度和司法可采性进行了系统阐述。可以看出,Chainalysis 希望推动行业关注的不只是分析结果本身,而是分析过程是否能够被解释、验证和复现。

这也可以看出,未来行业竞争的重点,可能不再只是“谁覆盖更多地址”“谁识别更多标签”,而是“谁的数据质量更高”“谁的分析更透明”“谁的证据更容易被法院采纳”。

对于监管机构、执法部门以及大型金融机构而言,一个能够解释分析逻辑、支持独立审计、具备可重复验证能力的系统,显然比一个只能输出结果的“黑盒模型”更值得信赖。

这项提案意味着什么?

从更长远的视角来看,Chainalysis 此次发布的并不是一个普通的软件升级,而更像是在推动区块链分析行业从“经验驱动”走向“标准驱动”。

如果这一 Ontology 最终得到行业广泛接受,不同分析机构、交易所、监管部门乃至司法机关,将有望在统一的数据模型下共享分析结果,降低沟通成本,提高证据的一致性,也为跨境执法、反洗钱调查和数字资产监管提供更加可靠的基础。

当然,标准的建立并非一蹴而就。如何平衡商业机密与透明度、如何推动不同机构采纳统一规范、如何持续完善证据模型,仍需要行业共同探索。

但可以肯定的是,随着数字资产逐渐融入全球金融体系,区块链分析的竞争重点正在发生变化:未来真正决定行业价值的,不只是算法的准确率,更是分析过程的可解释性、数据质量以及证据可信度。而这,也正是 Chainalysis 希望通过 Blockchain Tracing Ontology 所开启的新方向。

Disclaimer: This article is copyrighted by the original author and does not represent MyToken’s views and positions. If you have any questions regarding content or copyright, please contact us.(www.mytokencap.com)contact
More exciting content is available on
X(https://x.com/MyTokencap)
or join the community to learn more:MyToken-English Telegram Group
https://t.me/mytokenGroup