“隐语”是开源的可信隐私计算框架,内置 MPC、TEE、同态等多种密态计算虚拟设备供灵活选择,提供丰富的联邦学习算法和差分隐私机制。

开源项目:
https://github.com/secretflow

https://gitee.com/secretflow

 

一、什么是隐私计算

隐私计算是多种技术的统称,目的是为了让多个数据拥有者,在不暴露数据本身的前提下,实现数据的共享、互通、计算、建模,最终产生超出自身数据的价值,同时保证数据不泄露给其他参与方。

相比传统数据安全的方式,这里面的隐私计算是完全依赖技术手段的,从根源上切断对人的信任。实现参与方之间的可用不可见,在运作过程中它是可以防备参与方之间会存在攻击的情况。推进数据的安全和不泄露隐私,保护数据价值和用户的隐私。

二、隐私计算技术方向

1、多方安全计算(MPC)

基于密码学的隐私计算技术;该技术主要通过设计特殊的加密算法和协议,基于密码学原理实现在无可信第三方情况下,在多个参与方输入的加密数据之上直接进行计算,其主要的技术有同态加密、混淆电路、秘密分享、零知识证明等。

2、联邦学习(FL)

人工智能隐私保护技术融合衍生的技术;联邦学习是一 个机器学习框架,能有效帮助多个机构在满足用户隐私保护、数据安全和政府法 规的要求下,进行数据使用和机器学习建模。主要有横向联邦学习、纵向联邦学 习以及联邦迁移学习。

3、可信执行环境(TEE)

可信执行环境基于可信硬件的隐私计算技术。该技术主要打造一个区域,负责为代码的执行和数据的储存提供一个更加安全的地方,以此确保其机密性和不可篡改性。例如:Intel 的 SGX,采用一套面向 CPU 的指令,支持应用创建一个安全区,在该区域内通过指令进行相关的算法逻辑运算;而ARM的TrustZone则是将硬件与软件划分为两个环境,分别为安全环境和普通环境,安全环境能够进行一些保密操作,且普通环境无法访问,以此实现隔离。

4、同态加密(HE)

同态加密 (Homomorphic Encryption, HE) 是指满足密文同态运算性质的加密算法,即数据经过同态加密之后,对密文进行特定的计算,得到的密文计算结果在进行对应的同态解密后的明文等同于对明文数据直接进行相同的计算,实现数据的“可算不可见”。

5、差分隐私(DP)

差分隐私 (Differrential Privacy,DP)是Dwork等人在 2006 年针对数据库隐私问题提出的一种严格的、可量化的隐私定义和技术。差分隐私技术的基本原理是:在计算结果中添加噪声,使得修改数据集中单条记录不会对统计结果造成品著的影响,从而保证攻击者在拥有背景知识的情况下也无法推断出该记录对应的敏感信息。


当前,隐私计算领域正处于快速发展的阶段,涌现出了许多前沿的SOTA算法和备受关注的顶会论文。为了方便社区小伙伴学习最新算法、了解隐私计算行业最新进展和应用,隐语开源社区在GitHub创建了Paper推荐项目awesome-PETs(PETs即Privacy-Enhancing Technologies ,隐私增强技术),精选业内优秀论文,按技术类型进行整理分类,旨在为隐私计算领域的学习研究者提供一个高质量的学习交流社区。

awesome-pets包含:安全多方计算(MPC)、零知识证明(ZKP)、联邦学习(FL)、差分隐私(DP)、可信执行环境(TEE)、隐私求交(PSI)、机器学习系统的攻击和防御、多媒体隐私与安全等系列主题论文!