杭州区块链国际周丨矩阵元创始人孙立林:隐私计算将成为下一代计算架构
7月6日,由杭州市余杭区政府指导,杭州未来科技城管委会、巴比特主办的“2020杭州区块链国际周”进入第二天议程。当日下午,矩阵元创始人兼CEO孙立林受邀出席主会场活动并发表主题演讲《作为下一代计算架构的隐私计算》。
孙立林表示,如果只是泛泛地把现有金融业务搬到链上,其实是不需要的,因为它无助于现有金融基础设施综合成本和制度性交易成本的降低,这件事情没有价值。而只有在彻底的可计算资源交换维度之上,区块链才能发挥它的作用。
此外,他还透露称,本月矩阵元会正式跟一家全国性股份制商业银行宣布关于隐私计算方面的合作。他进一步解释道,下一代银行转向数字资产全面运营的趋势非常明显,而且从过去这些年的实践来看,新一代基础设施必须要服务于新一代的资产或者新一代的流动性,这是矩阵元着力于做隐私计算的原因。
以下为演讲全文:谢谢巴比特,谢谢王雷老师,每次巴比特活动我几乎都参与了,而每次基本讲的都是隐私计算,最近这个话题确实比较热,下面聊一聊我们对隐私计算整件事情的理解。
去年10-11月份,国家发改委发文,全国有几个地区被列为数据经济创新发展试验区,排序为雄安第一、浙江第二、福建第三、广东第四、重庆/四川并列第五。由此可见,去年起政府已经开始重视数据。只不过当时没有叫生产要素。
下面是这几年我们做隐私计算的基本理解,我们从2016年开始做区块链,深耕密码学。2017年把我们所做事情定位为隐私计算,并且将隐私计算定义为下一代计算架构。过去几年中,我们日益觉得隐私计算的方向应该是一个基本面。
和区块链一样,隐私计算不是单一技术。如果把区块链和隐私计算当技术去做,可能很难往下走,隐私计算应该是作为基础设施重要的一部分,或者本身就是基础设施的载体,天生是面向运营的生意和商业,而不是单独的“技术”。
数据资产泛泛而谈没有意义,因为单一的数据既不可被定价,也不可被交易。在过去几年各地建的大数据交易所其实都没有交易,这是非常尴尬的事情。真正有意义的事情,我们叫做数据的可计算性,或者是可计算资源。只有算子在计算需求加持下得到了计算结果,才能称为可计算资源,才可以被定价、估值和交易。泛泛说数据其实也意义不大。所以我们一直在向市场说明,可计算架构是新一代的计算架构,彻底将数据互操作互联网进化为计算互操作互联网,是带算子跑的。举个例子,假定一方有数据,按照目前行业的合规性,数据是不能够离库的。而另外一方如果有算子、有模型,尤其是金融行业,基于合规要求也不能离库。所以双方的合作基本为远程协同计算,在这种场景下,我们认为区块链才有价值。
所以如果只是将现有金融业务搬到区块链上,其实作用不大。因为区块链无助于现有金融基础设施综合成本和制度性交易成本降低,只有在彻底可计算资源交换之上,区块链才能发挥作用,体现出智能路由和清分的价值。
下面我们来看数据要素的全生命周期。我们在数据全生命周期的第一个环节,生产和采集端,布局了一家物联网区块链模组公司,来做端侧数据采集。但入口争夺日益激烈,现在各大运营商和各个物联网公司这样的入口,我们基本上都已经达成了合作,可能再往下就是展锐、ARM、高通这些公司,也基本快要签完了。鉴于今天趋势来看,我们会更关注国内新崛起的芯片公司,往底层持续发展。
我们一直把自己定位在数据的交换和共享,而且从优先级看共享高于交换,隐私计算的优先级是高于区块链的,其本质是运营商架构,但复杂度还是来自于对交易业务的理解。
最近隐私计算确实火了,很多人都会关注。甚至有些公司声称能做通用计算,我都会一一解释,通用计算目前看是不可能的。单论安全多方计算,前端的算子需求就有几十种,甚至更多的变化。目前为止,全世界也没有人可以做到这件事情。即便是美国现在水平最高的图灵奖得主Shafi Goldwasser等顶尖专家也做不到。只能做单一算子共享和交换,所以隐私计算距离平台化运营时间还非常长,目前还是从0到1的时间段内。今年确实涌现出一批做隐私计算的公司,但我相信技术积累还需要几年的时间。
对于AI和大数据算子的支持,目前不可能替代建模,隐私计算只是对建模,或者联合建模的训练和预测来做支持和赋能,本身不能替代建模。建模的过程不能在线上完成,还是要靠人。这里已经不是隐私计算和区块链的问题,AI也做不到这一点,金融机构里核心的模型都是靠人来做的。
这是我们一直在说的事情,要肢解和分拆现有的互联网公司,尤其互联网巨头要按照这个逻辑被肢解掉,否则他们已经严重触犯了所有的合规性,这一关是跑不了的。今年4月份,国家开始重视数据的合规性,我们和各地政府交流后,这个模型逐渐得到了大家的认可。在确保公民或者个人信息安全,确保机构间交易安全的情况下,不得不把这个模型分拆成三件事情,就是身份认证、可计算资源的存托、可计算资源的交易。所有互联网公司应该按照这个逻辑被拆解掉,互联网公司不应该同时拥有这三项能力。
目前看金融机构对这件事情的理解会透彻和紧迫一些,因为一家大中型银行每年数据购买成本在几个亿到十几个亿左右,所以自然会想到如何来控制数据风险。每个行里负责分管风险的领导,第一反应就是买的所有数据都必须是可认证、可追溯,在合规性上是安全的,并且我自己的模型和算子坚决不能披露。在这方面过去只能大量依靠人、机构、核心企业的背书。而从某种程度上说,大数据公司多多少少都徘徊在灰色产业边缘,是非常不安全的,因为他们拥有所有数据,即使号称所谓数据不落地,不进内存,不进硬盘,这本身也存在着可信问题,所以目前这种方式也会马上被彻底淘汰掉。基础没有打好,无法做业务运营。大家可以看到在这张图最下面的隐私计算。
今天广义上的隐私计算技术中包括三个流派:
第一个流派是密码学,包括MPC、HE等,通常把密码学这个流派叫隐私计算。
第二个流派是AI领域的联邦学习。
第三个流派是传统安全界出身,主做TEE。
矩阵元研发了一套全新的开源架构会支持所有的方案。但为什么在过去5年里坚定选了密码学方向?只有密码学主导的隐私计算,可以给系统提供一个可验证的安全性。联邦学习不可以,TEE也不可以,完全做不到。
作为一个运营要素级别资产的网络运营服务,如果不能做到可验证的安全性,它就不可以成为运营商,只能做项目。目前很多机构在提供联邦学习服务器,第一它存在第三方数据会聚点,这是不安全的。第二可逆推也不安全。TEE的问题更多,在商业环境里必须把数据交给第三方,哪怕是交给可信执行人也难免会有安全隐患,并且TEE已经被连续爆出漏洞。
这两个方案并不是不可用,如果只是对部分敏感数据进行处理的话没问题。但如果要给整个系统提供可验证的安全性,目前只有密码学可以,但这条路很艰难。
区块链体现的价值也很简单,在计算过程都保密的情况下,只有在链上才可以对数据贡献度做智能的清分和路由,这是巨大的价值,也是区块链唯一的价值。区块链不是万能的,比如单一地做存证溯源,对于这种量级的金融基础设施来说是没有意义的,因为不能保障综合性、制度性交易成本得到控制,就没有办法说服现有金融机构向区块链迁移。
可以和大家透露一下,本月,矩阵元会正式跟一家全国性股份制商业银行宣布基于隐私计算的全面合作。当然业务很复杂,本质是把银行整体从柜面到离柜,从前台到后台,所有的交易系统,所有的服务从前置到核心系统全部数字化。银行其实是有运营资金风险的,其资产负债表管理的是资金风险。而下一代银行一定会转向全面运营数字资产,这种趋势非常明显,我们正在配合很多银行做数字资产转型。这是我们做的初步架构,这个架构逻辑上大家理解并不复杂,技术当然很难,技术有它本身的难度。
我们在境外也做了很多面向金融机构的服务。从华尔街来看,会将隐私计算与区块链能力的基础设施全面定义成下一代分布式基础设施,几乎全球性商业银行总行都成立了相关的部门和团队,不仅仅做投资,而且在转变业务架构。
今年9月份-10月份,可能美国会宣布隐私计算与区块链领域非常重量级的并购,它引发的效果会与去年Facebook计划推出Libra之后,中国开始主推区块链很相似。这个消息如果正式宣布,相信大家会重新审视区块链和区块链的用途,以及什么是隐私计算。
最后说一下我的理解,从业务实践来看,新一代基础设施必须要服务于新一代的资产或者新一代流动性,这是我们着力于做隐私计算的原因。因为只有通过隐私计算可以帮助数据要素成为可管控资产,因此需要新的交易对手方机制,这就是隐私计算与区块链带来的价值。
谢谢大家。