数牍科技蔡超超:数据价值挖掘和保护可以兼顾,隐私计算已有不少落地案例丨MEET2022

有数据价值交换的地方,就有隐私计算需求的存在。

编辑部 整理自 MEET 2022
量子位 报道 | 公众号 QbitAI

AI和大数据时代,我们似乎总在面临隐私和便利性的抉择。

例如,交出自己的定位信息和设备信息,获取导航的便利性;交出自己的面部信息和个人信息,获取身份认证的便利性;交出自己的电话信息,获取快递外卖上门的便利性……

但数据流通范围越大,信息泄露的概率也就越大,说不定你的信息被数次转手后,就被低价卖给了不法分子。

这种情况下,一种尝试兼顾信息保护和数据流通两大特点的技术体系浮出水面,它便是隐私计算

在MEET 2022智能未来大会现场,数牍科技联合创始人兼CTO蔡超超指出:

有数据价值交换的地方,就有隐私计算需求的存在。

为了完整体现蔡超超对于隐私计算的思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。希望也能给你带来新的启发。

关于MEET 智能未来大会:MEET大会是由量子位主办的智能科技领域顶级商业峰会,致力于探讨前沿科技技术的落地与行业应用。MEET2022采取线上参会形式,20余家直播平台和渠道转播大会直播,200万行业用户线上参会。除量子位微信、头条号、知乎、微博等全媒体矩阵外,新华社、凤凰科技、腾讯科技、澎湃新闻等数十家主流媒体纷纷报道大会及相关内容,线上曝光量累计超过2000万。

演讲要点

  • 数据的开放共享,建立在安全保护的基础上;数据价值的挖掘,更需要底层基础设施的保驾护航。
  • 有数据价值交换的地方,就有隐私计算需求的存在。
  • 隐私计算体系不是单一的系统,而是一个网络、一个底层平台。
  • 基于隐私计算的ID系统可以达到匿名化要求,无法识别特定自然人且不可追溯。
  • 随着越来越多复杂的隐私计算应用场景出现,多种技术的融合是行业的必然趋势。

(以下为蔡超超演讲分享全文)

隐私计算究竟是什么?

今天,我将分享的主题是“隐私计算,构建下一代数据流通的底层关键技术”。

刚刚,有几位不同行业的专家都提到了AI和数据的开发与利用,比如智能驾驶。其实我接下来讲到的隐私计算,也会涉及智能驾驶的场景。

现代汽车如同智能手机一般,是高度信息化和智能化的。在运行过程中,汽车上的设备会采集大量图片、音频和位置等数据,其中就包含不少车主的隐私数据。

如何在保护数据安全的情况下,高效开发并利用数据,涉及到隐私计算的技术支撑。

不仅是汽车行业。我国在国家战略层面上,全面提出要推动数据要素市场发展与数据资源的开放利用。

数据的开放共享,建立在安全保护的基础上;数据价值的挖掘,更需要底层基础设施的保驾护航。

隐私计算,是数据流通的重要组成部分。据估计,隐私计算技术的全球市场规模达到一万亿,Gartner更是它作为2022年需要探索的重要战略技术。

隐私计算将覆盖金融、政务、互联网等领域,可以说有数据价值交换的地方,就有隐私计算需求的存在

隐私计算具体是什么?

它是一种在数据不可见的前提下,让信息进行价值流通的工程体系。

它的成熟和落地,需要靠多项技术的共同发展来支撑,包括数十年密码学理论的积累、云计算的发展、MPC技术突破、AI技术的覆盖和大数据基础设施的完善。

隐私计算不是单一的技术,而是一个技术体系,包含多方安全计算、联邦学习、可信执行环境、差分隐私、同态加密、区块链等技术,可以实现数据的可信挖掘以及可信存证。

不过,隐私计算体系也不是单一的系统,而是一个网络、一个底层平台,这个平台包含各种参与方,可以由人、物、汽车或其他各种各样的主体组成。

具体来说,每个主体都拥有一个专属ID,像身份证、电话号码、设备号、汽车的VIN number等等。因此,在进行数据合作之前,需要一个共同语言把这些ID有效地映射(mapping)起来,使之成为数据的统一语言,以进行安全数据协作。

为了实现这个系统,由数牍科技参与研发和运营,中国信通院、中国商务广告协会联合电信运营商,共同推出了行业通行ID「ONEID」

不交换原始数据,也能安全完成数据协作

ONEID是一个依托中国信通院数据安全体系,基于运营商认证能力生成匿名广告标识,结合隐私计算的,是一个符合中国法律法规的独立于手机操作系统生态的ID体系。

基于隐私计算的ID系统可以达到匿名化要求,无法识别特定自然人且不可追溯,还可以充分保证信息安全性,有效将多方ID进行对齐,提供后续数据价值流通的可能性。

在完成数据对齐后,还需要更进一步的数据价值流动。

因此,除了ONEID系统,数牍科技还推出了自主研发的隐私计算平台Tusita,在不交换原始数据的前提下,让多方能够进行安全合规的数据协作。

这里有两个非常典型的例子。

第一个例子,今年8月,广东人民检察院公布了一起典型的诉讼案。案例显示,某银行王姓客户经理,近两年利用职务之便,非法出售了31465条在业务活动中获取的银行客户账户信息,以此赚取收益。

这些被非法出售的信息包括不少像客户姓名、身份证号码、电话号码、银行卡账号这样的敏感信息,大多数流向了贷款公司,被用于电话销售。

在信息流通中,由于缺乏一个有效安全的技术措施,导致客户的具体信息被有意或无意泄露,相关隐私信息出现不可控性。

第二个例子,也是在今年8月,另一个地区的一家中小微企业想去申请银行贷款。由于公司起步不久,财务制度还不健全,加上银行拥有的信息样本有限,导致银行在进行贷前调查时,往往需要花费很多人力和成本,这家小微企业也难以及时申请到贷款。

这两个案例说明,一方面个人信息亟待保护,另一方面数据流通又已经成为一种刚需

因此,在合法合规的前提下,引入多维度高价值数据非常重要。

基于这些痛点打造的Tusita隐私计算平台,可以有效地平衡数据挖掘和数据保护的需求,目前已经在金融、电信、消费品、政务等多个行业得到了落地与应用。

解决数据泄露、本地缓存等问题

在金融行业,我们推出了一整套面向数据的、全生命周期的安全协作解决方案,覆盖风控、营销、金融集团内部协作、存量客户分层运营等应用场景,目前已经有不少具体的落地案例。

举个例子,在贷前准入的数据协作场景中,金融机构通常需要对客户进行多要素的实名认证及相关核验。

传统模式下,双方机构通过系统对接,其中金融机构需要通过API来查询数据、验证客户相关信息。这种模式容易导致金融机构潜在客户信息被泄露,或是运营商则数据被缓存。

隐私计算平台则能很好地解决上述问题。通过平台,金融机构可以通过三要素验证等方式,查询匹对电信运营商的客户信息名单,在不泄露客户信息的情况下,查验三要素信息是否正确。

在这种情况下,隐私数据就能确保“可用不可见”。

其中,数据方无需获取用户信息,就能统计查询笔数;查询方不能获知数据方除交集数据外的其他数据,但客户三要素等信息也不需要出库,无需担心第三方缓存的问题。

针对不同的行业场景,隐私计算产品Tusita可以用于反欺诈、反洗钱、精准营销、联合风控、赋能保险企业数字化运营等一系列场景。

除此之外,隐私计算平台还可以用于支持企业的数字化运营。

例如,保险公司会通过正向方式,获得一些存量客户线索。然而,由于客户与保险公司的互动极少,使得公司无法对存量客户进行有效挖掘。

为此,我们通过隐私计算的方式,采用数据对客户进行多重的客户分层与挖掘,使得中间具有高意向购买其他长期险种的客户也能得到有效分层排序,最终让保险公司的整体投保率提升1.8倍。

当然,这种方式不仅可以赋能于保险行业,也能应用于任何企业营销或者数字化经营行业。

除了金融、保险行业,数牍科技也与运营商之间有着非常紧密的合作。

目前,数牍科技已经成为运营商第二代数据的底座建设平台提供商,为他们提供整体的隐私计算解决方案。

“需要完整的数据科学应用体系支撑”

作为一个初创企业,数牍科技成立于2019年,这两年一直在高速发展。

2019年成立后,发布了第一版全国产化的自研隐私计算平台体系;2020年,数牍科技在行业内首先落地运营商场景,成为联通隐私计算平台技术合作方,并与联通共同完成行业首个TB级隐私计算商用项目落地;在2020和2021年,为多家头部国有银行提供隐私计算服务和技术支撑。

2021年,我们先后入选上海数据交易所、西部数据交易中心首批签约数商,并将作为深圳数据交易所首批数据服务商之一参与数据交易服务,为深圳数据交易所提供数据流通环节中的隐私计算技术支撑。

我们坚信,在隐私计算平台的发展过程当中,需要特别注重以下几点。

第一点,安全可靠性。这也是我们Tusita平台一直坚持的目标,即通过“计算分布式,流通可监管”的架构,使得客户能以本地存储与完全可控的模式管理数据,平台不参与计算、不触碰具体数据。

第二点,完整的数据科学应用体系。平台可以实现完整的数据分析、特征加工、全流程可视化模型建设与后续挖掘。

第三点,工业级的落地能力。平台需要具备高扩展性、支持快速部署,同时也支持海量数据的挖掘和分析,包括亿级模型建设以及数十亿级数据分析的能力。我们已经服务了像运营商、金融、政务等多个行业的客户,为国有企业、央企与政府之间的数据合作提供了广泛落地支撑。

随着越来越多复杂的隐私计算应用场景出现,多种技术的融合是行业的必然趋势。

大家可以关注一下我们的公众号(数牍科技),上面有我们的进展、行业研究,以及一些行业报告;有兴趣也可以持续关注一下我们的ONEID产品,谢谢。

版权所有,未经授权不得以任何形式转载及使用,违者必究。