暴走恭亲王:它知道你是谁!水面下的区块链监管科技!
作者:暴走恭亲王
前两天被网信办的《区块链信息服务管理规定》刷了屏,很多人都在讨论这样的监管到底是否合理,或者应该如何操作。我在之前的《500年金融变局!你能想象人人发资产的世界吗?》中也提到了行业需要监管,并且最好的方式就是技术型监管。总有些人给我反复扣帽子,说我就是反对监管,或者我认为监管是无意义的。也有同学私信我说,文中提到的的先发行后监管就是不监管,因为一旦进入进入到区块链就完全无法后期监管,区块链的匿名和不可篡改都会让监管失效。
我觉得这不仅是误解了我的看法,也误解了区块链技术,技术永远是双刃剑,从互联网的发展历史就可以看出,它不仅仅会为生产力或创造性提供更大的动力,其实也是为监管提供了更加强有力的工具。互联网的发展完全体现了这样的特点,在一开始,很多人都认为网络很像无主之地,非常难以干预和管理。但到了今天,我们自己可以看到,在监管部门也使用了互联网技术之后,监管能力不仅没有被削弱,反而是极大增强了。
其实当技术发展到大数据和人工智能阶段,对于数据的管理已经和过去不可同日而语。数字货币是基于区块链技术,而区块链本身是一个强有力的大规模高精度的数据协作工具,所有的数据都记录在链上很难篡改。因此,这对于监管来说不是难了,反而是更加简单了。从监管者的角度,在区块链行业不像传统领域,要个企业进行分门别类的统计、汇总、然后再上报到各级组织。监管机构只要有恰当的工具,就能够对链上数据随时进行监测和分析,就可以知道几乎全部的真实情况。
当我说到人人可以发资产,有些同学就可能认为我是一个无政府主义者,或者是反对监管。恰恰相反,我始终认为监管是非常重要,是行业健康发展的必然要素,因此我个人投资和参与了很多与区块链监管相关的项目。对于目前针对区块链的监管科技(RegTech),国内公开的探讨比较少,最新的技术和进展也很少会披露。我们LongHash本身就提供一些相关的数据服务,并也和一些国家政府在进行技术监管方面的项目合作,我希望借本文把我所了解的情况和大家分享一下。考虑到篇幅和非IT出身的阅读者,有些技术细节可能就不说的太详细了,但是从大致的思路完全可以推测未来监管科技的发展路径。
数据监测和交易分析
谈到区块链技术,很多人都认为“匿名”是该技术的特点。即使对于很多业内的人士,也普遍认为只要随时使用新的地址,并且不公布任何本人和地址的关联信息,就能确保匿名安全。其实这也许仅仅只是设计的初衷,是很多人美好的愿望。
但对于监管者而言,随着比特币和区块链技术变得愈加有影响力,而且相关的犯罪行为越来越多,如何监管和有哪些工具平台可以进行监管,这些问题都已经摆在了各国监管部门的前面。
WanaCrypto勒索软件
2016年,就有一款名为WanaCrypto的比特币勒索病毒在全球爆发,波及范围超过全球70个国家,网络黑客通过勒索软件电子邮件,要求中毒者支付比特币作为赎金赎金,赎回被软件加密的重要文件。尽管这个问题很快就被解决,但还是让很多人心有余悸。除了勒索病毒之外,包括使用比特币买卖枪支、毒品甚至是洗钱的传闻在各种媒体上不断出现。
遭受比特币勒索软件攻击
早在若干年前,很多国家就已经和一些区块链公司在进行研究各种监测工具和解决方案。也有很多数据提供商提供相关的服务,其中最有名的是Chainalysis。
Chainalysis公司成立于2014年,主要为加密货币交易所、国际执法机构、以及其他客户提供比特币交易分析软件,帮助他们遵守合规要求,评估风险,并且识别非法活动。值得一提的是,该公司曾帮助调查过Mt.Gox的破产案。从目前行业发展趋势来看,大多数政府监管机构直接从数据服务商购买这样的服务。包括巴克莱银行也是使用Chainalysis来事实监控比特币区块数据。
在所有相关的服务中,最基础的就是对数据进行备份和分析标注。对于任何公链的项目来说,除了Ripple这种并非真正意义上的区块链项目,一般不需要任何组织或者个人的批准或者首肯,你只要自己提供一个完全节点,基本就可以获得链上从创始区块开始的每一笔交易记录。然后根据需要对数据进行拆解和标注。
在LongHash.com的首页上面有个一个比特币的免费公开数据查询接口,只要输入任意比特币地址就可以查看这个地址的评估分数和最近三层的交易。
LongHash的比特币地址分析
这里面的细节和可以展开的工作非常繁多,不是这一篇小小的普及文章能说完的,大致就是根据所有的交易行为模式进行分辨,最容易识别出的是大多数交易所和一些主要的鲸鱼地址(大户)。然后可以根据不同的行为模式,来标注个人用户、机构用户以及商户不同的身份。此外,还会根据已经暴露在互联网和暗网上的地址也可以作为参照来标准。
参与者定位
第二类技术就是定位了,监测并找到到底是谁发起和参与了这些交易。
不同于与金融系统的KYC(know your customer,了解你的用户),在区块链上一般称之为KYT(Know Your Transcations)。这是因为在链上我们一般只有交易数据,没有个人的数据,让很多人以为区块链能够很好的匿藏你自己的身份。但事实并非如此,因为通过对节点监控就可以了解很多的事情。
早期比较常见的是对于区块链节点进行数据监控,根据一些美国安全领域的朋友所说,所有BCH在AWS作为部署节电而租用服务器都是完全收到美国政府的监控,并且这已经是一个较为公开的秘密了。很多监管部门都在搜集相关完全节点的信息,并且对租用者的信息进行分析和备案。
比特币节点分布
大多数区块链的标准节点为了匿名是不记录很多信息广播者的信息。但现在已经进入到主动出击的阶段,就是通过部署特别的节点来记录和寻找交易广播者的情况。
我们孵化和投资的TokenStud.io项目,就提供一个名为 Beacon(灯塔)的交易定位解决方案。该方案对所有主流的链上部署很多特殊的节点,称之为 probe。这种 probe 节点与正常节点在转发数据等动作都是完全一样的,没有人能识别出 probe 节点和普通节点之间的差异,但 probe 节点会搜集并记录所有转发过来数据的IP地址和相关路由数据。
TokenStud.io 区块链安全解决方案服务提供商
基于这些广播数据的信息传播属性,通过使用朴素贝叶斯分类器(naive Bayes classifier)建立一个数学模型,寻找最有可能控制该地址的客户端,因为每个probe就有机会获得收到来自各个“方向”的同一笔交易广播数据,而根据收到交易对时间差的统计分布能大致确定广播的位置,从而识别出比特币地址IP地址。而通过客户端的IP地址,监管机构就可以确定它们的地理位置,并且还能实现对数字货币分布和流量的空间分析。
显然,只要部属的“探针”节点越多,那就意味着它来定位某个特定交易的几率越高。理论上来说只要probe节点占总完全节点数量的10%,并且位置比较平均,就有超过60%几率将你的地址缩小到很小的范围。随着probe数量增加,可以极大的提高识别准确度。对于政府的监管预算来看,这些费用是几乎可以忽略不计的,也就是说,只要监管部门加大投入,是可以建立起针对主流数字货币完整的监管体系。
一旦这样的方案数据进入成熟阶段,将之前的地址标注数据,交易行为模式数据,结合probe节点记录的IP和路由数据,再包括交易所的KYC数据,将构成一个全新的、针对数字货币的反洗钱系统。不同于传统反洗钱系统是完全基于KYC来构建的,这个全新的反洗钱系统是基于KYT和大数据来实现的。对于大多数区块链的普通用户都将处于监控范围之内,并且对于任何可疑的交易以及可疑交易者进行快速定位。根据目前测试阶段的方案来看,基本上也可以在秒级对主流数字货币的交易进行评估和报警提示。
更多算法的细节大家可以查看Péter L. Juhász, József Stéger等人撰写的论文。
反混币算法
对数字货币行业非常熟悉的人,看了前面的方案可能会脱口而出说,希望匿藏踪迹的人还是可以通过“混币器(Mixer)”服务来反追踪。
所谓的“混币器”服务简单说,就是将若干笔交易打乱,让原本清晰的AB交易以及CD之间交易,变得非常复杂,看上去是ABCD之间的复杂交易。由于交易中包括大量输入和输出,很难在输入和输出中找出每个人的对应对,输入与输出之间的联系被事实上割裂。每次混币操作,有越多次混币、且每次少量币,效果更好。
比特币的混币器原理
如果手工来实现混币是很复杂繁碎的,但是用程序来做就要简单得多。已经有很多网站提供混币服务,比较知名的有BitMixer.io。这是网络上最受欢迎的比特币混币服务商之一,满足了大量比特币混币服务需求,自2014年开始运营。根据该网站显示,该平台每月处理65,000个比特币。Bitmixer提供每个订单的数字签名证明,并能够提供大数量的即时混合服务。
知名混币服务提供商BitMixer.io于2018年7月停止服务
混币器和混币服务往往打出的旗号是保护隐私,但事实上大多数会使用这些服务的用户,很可能是为了掩盖犯罪行为。因此这类网站会受到来自于各国执法机构的巨大压力。2017年7月,Bitmixer.io突然宣布将关闭混合比特币交易的相关业务,估计也是因为受到了来自支付机关的压力。但到目前为止,还是有很多网站,特别是在暗网还有很多此类服务提供商。
混币器是数字货币常用来规避追踪的方式,会极大的增加追踪的难度,特别是很多种混币算法,如果你希望用普通算法逻辑来反向理清是几乎不可能的。而对于这种方式,之前常见的监管方式是,监管系统对疑似混币行为进行标记。因为虽然很难确认经过混币的数字货币的最初来源,但混币行为本身还是很容易识别出来的。任何最近经过混币交易的数字货币,都是标注为“来源可疑”或者“有潜在风险”。如果某笔交易的数字货币在之前的5层交易内有经过混币行为,则是认为存在风险。
LongHash东京Hackathon 2018
标注是一种简单的防御性监管,但最好的办法还是主动出击,直接拆解“混币”。在2018年,LongHash在东京举办的区块链Hachathon上,有一支来自卡耐基梅隆(CMU)的团队脱颖而出,他们使用人工智能算法在反洗钱方面做出了一个很有趣的原型。
GraphWave算法
他们发现混币技术会让加密代币的交易拓扑结构方面有一些相似之处,尽管每种混币技术的方式可能不尽相同,但知道他们可能有类似的混合步骤来掩盖资金流的来源和目的地。在使用斯坦福在2018年提出的GraphWave的人工智能算法,通过机器学习方式来分辨各种混币模式,然后根据特定的混币模式来分析混币前的原始状态。
GraphWave原理
GraphWave是斯坦福大学发表于 KDD ’18 的工作,论文提出了一种通过利用热小波扩散模式、通过低维嵌入来表示每个节点的网络邻域的方法。能够自动学习并识别图节点的结构角色。GraphWave 不是在手工选择的特征上进行训练,而是以无人监督的方式学习这些嵌入。在数学上证明具有相似网络邻域的节点将具有类似的 GraphWave 嵌入,即使这些节点可能驻留在网络的非常不同的部分中。
在这里就不赘述该技术的过多细节,对于该算法有兴趣的同学们可以去网站了解更多的情况( http://snap.stanford.edu/graphwave/ )
CMU团队在Hachathon上演示
魔高一尺,道高一丈
监管和反监管的技术攻防站是始终在进行的,很多“专业的高风险人群”在了解了目前的监管模式后,基本已经放弃使用比特币来从事“高风险”行为。而转为使用包括像Zcash或者是Monero这样主打“匿名”特色的数字货币,通过使用“零知识证明”或者“环签名”这样的方式来试图解决追踪交易痕迹的问题。此外,一旦知道了大致的监管思路,也会有更多的其它模式来规避,本文就不讨论这些细节了。显然,这种攻防战是永远没有止境的,但在此消彼长的对抗中,也许能够成为促进行业健康发展的催化剂。
基于区块链技术的监管科技是一个比较小众的话题,对大多数普通投资者可能也非常陌生。事实上,区块链的监管科技在目前全球发展的非常快,早在2013年,就有一些优秀的公司在做这方面的探索,并且也取得了不小的成绩。早期比较出众的还有分布式资本投资的Blcokseer,他们很早就开始和FBI进行合作,追踪包括“丝绸之路”在内的各类基于比特币的非法交易。
BlockSeer网站
数字货币和区块链技术本身其实已经发展为一个很大的行业,和中国的情况不一样,除了挖矿和交易之外,很多其它细分领域也发展的非常快,这也是为什么我常说的,国内其实只有数字货币交易所行业,并没有真正的区块链行业。类似于区块链数据提供商,数据服务提供商在未来也会成为一个较大的创业领域。
我写这篇文章,主要是想说明,区块链并不是一种完全无法监管的科技,即使进入到人人都可以发资产的时代,也不要真的以为骗子可以横行,到处都是非法交易。另一方面,也不要认为自己持有数字货币,就可以为所欲为,真的没有任何人可以追踪到你,这种想法是很幼稚的。更重要的是,希望监管部门重复理解区块链的监管科技,完全不需要担心无法应对区块链技术。目前,一些国家的监管部门面对数字货币这个全新事物有些茫然和警惕,完全不知道该怎么下手去监管,所以可能更加倾向于一刀切的法规型监管。
我始终相信技术的步伐不会停止,技术也永远是双刃剑,我们可以用技术来犯罪,也可以用技术来监管犯罪。网信办发布的《区块链信息服务管理规定》被不少人提出疑问,认为不符合区块链的技术特性,因为显然有资格备案的就不属于去中心化的区块链技术(要求),而只要是去中心化区块链技术就没有资格备案。我相信监管机构肯定也有自己的考虑,长远来看,这些都不是很大的问题。因为这都是在新技术发展中必然经历的阶段,作为一个始终谋求行业能够健康发展的参与者而言,相信通过针对区块链技术特点的监管科技来进行监管,也许才是行业未来监管发展的方向。
最后附上区块链监管科技的生态企业和项目一览图,希望对各位同学能有所帮助。