从“地址聚类”到“证据标准”：Chainalysis为何要重新定义区块链追踪？

作者：137Labs

2026年6月底，Chainalysis 对外公布了一套名为《Blockchain Tracing Ontology（区块链追踪本体）》的数据框架，希望为区块链分析建立更加统一的数据描述体系。相比过去发布的新产品或新功能，这份文件更像是一项行业标准倡议：它试图重新定义链上数据分析的基本概念，并为区块链追踪建立一套可解释、可验证、可复现的数据模型。

这份提案发布后，很快成为区块链分析和数字资产合规领域关注的话题。尽管目前仍属于公开讨论和行业倡议阶段，但它已经让人们开始重新思考：链上分析是否需要一套更加统一、透明的数据标准。

一个长期存在的问题：不同公司为何会得出不同的分析结果？

区块链数据天然公开透明，但如何解释这些数据，却一直缺乏统一标准。

目前，大多数链上分析平台都会使用“地址聚类（Address Clustering）”技术，通过交易行为推断哪些地址可能由同一主体控制。然而，不同机构采用的算法、规则和证据来源并不一致，因此同一地址在不同平台可能对应完全不同的归属结果。

例如，一家分析机构可能认为某地址属于某大型交易所，而另一家机构则将其标记为未知钱包；同一批地址，在不同平台中也可能被划分到不同的 Cluster。这种差异对于市场分析影响有限，但一旦涉及司法调查、资产冻结、反洗钱或执法取证，就可能带来较大的争议。

对于法院而言，仅仅给出“这是某交易所的钱包”这样的结论远远不够，更重要的是回答另一个问题： 为什么可以得出这样的判断？

Chainalysis提出的不是新算法，而是一套“语言”

很多人看到“Ontology（本体）”这个词，容易误以为 Chainalysis 又提出了一种新的聚类算法。实际上并非如此。

Ontology 是知识工程领域的概念，指的是一套统一的概念体系和关系模型，用来规范不同对象之间的定义及其关联方式。互联网搜索、医学知识库乃至人工智能知识图谱，都大量使用 Ontology 来保证数据能够被统一理解。

Chainalysis 希望做的，是为区块链分析建立类似的“共同语言”。

换句话说，它并不是规定所有公司必须采用相同的聚类算法，而是希望大家能够按照统一的数据结构来表达分析结果，让分析过程更加透明，也便于第三方理解、验证和复现。

“Cluster”已经不够用了

过去，行业普遍采用“Cluster（地址簇）”作为分析的基本单位，即认为多个地址共同属于一个钱包或一个实体。

这种方法虽然简单直观，但随着区块链基础设施的发展，其局限性越来越明显。

如今，一个大型交易所的钱包体系可能包含数百万个地址，不同地址承担着充值、提现、冷热钱包管理、归集、找零等完全不同的功能。如果仍然简单地把它们全部归为一个 Cluster，就难以准确描述复杂的钱包结构。

因此，Chainalysis 在提案中提出了“Wallet Segment（钱包片段）”这一新的概念。

在新的模型中，一个实体（Entity）可以拥有多个钱包（Wallet），每个钱包又可以划分为多个 Wallet Segment，而每个 Segment 下才包含具体地址。这种分层结构比传统的 Cluster 更能真实反映大型机构的钱包管理模式，也能够更细致地描述不同地址之间的控制关系。

从“结果可信”走向“过程可信”

相比模型本身，更重要的变化来自第二层设计。

传统的链上分析，更多关注的是最终结果——地址属于谁、资金流向哪里、是否涉及非法活动。

而新的 Ontology 更强调推断过程本身。

对于每一项分析结果，都应该明确回答几个问题：

这一结论依据哪些链上证据？
使用了哪些分析规则？
是否引用了链下信息？
这一推断的可信度是多少？
第三方是否能够重新验证这一过程？

换句话说，不仅要告诉别人“是什么”，更要解释“为什么”。

Chainalysis 将这一部分称为 Evidence（证据）与 Confidence（可信度）层。

未来，一个地址被标记为交易所钱包，不再只是一个简单标签，而会伴随完整的推断依据，包括交易模式、地址关系、公开信息、调查记录等，并给出对应的可信度等级。这种设计更符合司法证据对于可解释性的要求，也有助于不同机构之间开展交叉验证。

Bitcoin Fog案件带来的启示

事实上，这份提案并非凭空产生，而是与美国著名的 Bitcoin Fog 洗钱案件密切相关。

Bitcoin Fog 曾是比特币历史上持续时间最长的混币服务之一。美国司法部在调查过程中大量采用了 Chainalysis Reactor 的分析结果作为关键证据。

案件审理期间，法院举行了著名的 Daubert 听证会，对 Chainalysis 的分析方法进行了严格审查，包括：

地址聚类是否具有科学依据；
分析方法是否能够重复验证；
是否属于不可解释的“黑盒算法”；
其他专家是否能够独立复现分析过程。

最终，法院认可了 Chainalysis 的分析方法具有足够的科学可靠性，可以作为司法证据使用。

不过，这一案件也暴露出整个行业存在的问题：如果不同分析机构采用不同标准，未来类似案件可能面临更多质疑。因此，建立统一的数据表达和证据框架，成为 Chainalysis 推动 Ontology 的重要背景。

区块链分析不能直接识别真实身份

值得注意的是，Chainalysis 在此次提案中特别强调了一点：链上分析本身无法直接识别现实世界中的个人身份。

链上数据只能揭示地址之间的关系和资金流动路径，至于地址背后的真实控制者，通常仍需依赖链下证据，例如交易所 KYC 信息、法院调取的数据、执法机关获取的服务器日志等。

这意味着，区块链分析提供的是一种高质量的数据推断，而不是直接证明身份的最终证据。真正完整的司法证据链，需要链上数据与链下调查相结合。

从数据质量走向行业标准

除了 Ontology 本身，这次提出的整体框架还围绕数据质量、分析透明度和司法可采性进行了系统阐述。可以看出，Chainalysis 希望推动行业关注的不只是分析结果本身，而是分析过程是否能够被解释、验证和复现。

这也可以看出，未来行业竞争的重点，可能不再只是“谁覆盖更多地址”“谁识别更多标签”，而是“谁的数据质量更高”“谁的分析更透明”“谁的证据更容易被法院采纳”。

对于监管机构、执法部门以及大型金融机构而言，一个能够解释分析逻辑、支持独立审计、具备可重复验证能力的系统，显然比一个只能输出结果的“黑盒模型”更值得信赖。

这项提案意味着什么？

从更长远的视角来看，Chainalysis 此次发布的并不是一个普通的软件升级，而更像是在推动区块链分析行业从“经验驱动”走向“标准驱动”。

如果这一 Ontology 最终得到行业广泛接受，不同分析机构、交易所、监管部门乃至司法机关，将有望在统一的数据模型下共享分析结果，降低沟通成本，提高证据的一致性，也为跨境执法、反洗钱调查和数字资产监管提供更加可靠的基础。

当然，标准的建立并非一蹴而就。如何平衡商业机密与透明度、如何推动不同机构采纳统一规范、如何持续完善证据模型，仍需要行业共同探索。

但可以肯定的是，随着数字资产逐渐融入全球金融体系，区块链分析的竞争重点正在发生变化：未来真正决定行业价值的，不只是算法的准确率，更是分析过程的可解释性、数据质量以及证据可信度。而这，也正是 Chainalysis 希望通过 Blockchain Tracing Ontology 所开启的新方向。