潮科技 | 隱私計(jì)算應(yīng)用場景詳解
隱私計(jì)算(Privacy Computing),指在保護(hù)數(shù)據(jù)本身不對外泄露的前提下實(shí)現(xiàn)數(shù)據(jù)分析計(jì)算的一類信息技術(shù),主要分為可信硬件和密碼學(xué)兩大技術(shù)領(lǐng)域。隱私計(jì)算是目前實(shí)現(xiàn)數(shù)據(jù)安全和數(shù)據(jù)合規(guī)分享的技術(shù)路徑,本文將從技術(shù)概念介紹和應(yīng)用場景出發(fā)進(jìn)行介紹。
實(shí)現(xiàn)隱私計(jì)算的相關(guān)技術(shù)
當(dāng)前實(shí)現(xiàn)隱私計(jì)算的技術(shù)主要可分為可信計(jì)算和密碼學(xué)兩大方向。
可信硬件
可信硬件指可信執(zhí)行環(huán)境,核心思想是構(gòu)建一個(gè)安全的硬件區(qū)域,各方數(shù)據(jù)統(tǒng)一匯聚到該區(qū)域內(nèi)進(jìn)行計(jì)算。比較有代表性的是Intel-SGX、ARM-TrustZone、Ucloud-安全屋等。特點(diǎn)是速度快、語言更友好、算法更通用。
密碼學(xué)
密碼學(xué)指用算法實(shí)現(xiàn)對計(jì)算過程中的數(shù)據(jù)保護(hù),以多方安全計(jì)算、聯(lián)邦學(xué)習(xí)等為代表。
-
多方安全計(jì)算
即MPC,針對無可信第三方情況下,安全地進(jìn)行多方協(xié)同的計(jì)算。在一個(gè)分布式網(wǎng)絡(luò)中,多個(gè)參與實(shí)體各自持有秘密輸入,各方希望共同完成對某函數(shù)的計(jì)算,要求每個(gè)參與實(shí)體除計(jì)算結(jié)果外,均不能得到其他參與實(shí)體的任何輸入信息。多方安全計(jì)算包含的基礎(chǔ)技術(shù)有很多,比如同態(tài)加密、秘密分享、不經(jīng)意傳輸、混淆電路等。
多方安全計(jì)算更多地是解決初級的算子,比如加、減、乘、求交等運(yùn)算。比較有代表性的企業(yè)和平臺是華控清交(Privpy)、螞蟻金服(Morse)、富數(shù)科技(Avatar)、百度(點(diǎn)石)等。
-
聯(lián)邦學(xué)習(xí)
即Federated Learning,基于多方數(shù)據(jù)進(jìn)行聯(lián)合建模,各自原始數(shù)據(jù)不對外輸出,由中心方進(jìn)行協(xié)調(diào)的建模,都可成為聯(lián)邦學(xué)習(xí)。
聯(lián)邦學(xué)習(xí)更多地是解決聯(lián)合建模的業(yè)務(wù)問題,比如信貸風(fēng)控中的常用的邏輯回歸建模評分、精準(zhǔn)營銷中的常用的XGBOOST分類等建模。比較有代表性的企業(yè)和平臺是微眾銀行(Fate)、螞蟻金服(Morse)、富數(shù)科技(Avatar)、平安科技(蜂巢)、數(shù)牘科技等。(注:以上部分參考中國信通院對隱私計(jì)算的相關(guān)定義)
隱私計(jì)算的客戶與場景
由于多行業(yè)均存在數(shù)據(jù)合規(guī)流通的需求,隱私計(jì)算的落地場景也分散于各行各業(yè)。以下列出了政務(wù)、醫(yī)療、金融、廣告、供應(yīng)鏈等行業(yè)對隱私計(jì)算的具體需求,希望介紹隱私計(jì)算的落地方向。
隱私計(jì)算"客戶"拓?fù)鋱D
政務(wù)大數(shù)據(jù)
當(dāng)數(shù)據(jù)成為生產(chǎn)要素之一,將政務(wù)大數(shù)據(jù)賦能于新基建下的各行各業(yè)也成為一個(gè)重要課題。因此,政務(wù)大數(shù)據(jù)機(jī)構(gòu)是隱私計(jì)算的重要客戶之一,具體包括司法數(shù)據(jù)、社保數(shù)據(jù)、公積金數(shù)據(jù)、稅務(wù)數(shù)據(jù)、水電燃?xì)鈹?shù)據(jù)、交通數(shù)據(jù)、違章數(shù)據(jù)等。
政務(wù)大數(shù)據(jù)
政務(wù)大數(shù)據(jù)的隱私計(jì)算應(yīng)用場景
舉例來說,智慧城市就是一個(gè)復(fù)雜、錯(cuò)綜、協(xié)助、共創(chuàng)的業(yè)務(wù)生態(tài),包括信用、安保、能源、交通、規(guī)劃、環(huán)保、文旅等各個(gè)行業(yè),業(yè)務(wù)數(shù)據(jù)涉及到跨部門協(xié)同。智慧城市中打通以人為中心的數(shù)據(jù)也是“城市數(shù)據(jù)中臺”的概念,這需要通過對城市居民的多維度信用評級,授予或者限制更多的權(quán)限。要做到對個(gè)人聯(lián)合風(fēng)控,其中需要橫向打通的數(shù)據(jù)包括交通出行數(shù)據(jù)、水電燃?xì)鈹?shù)據(jù)、公安數(shù)據(jù)、征信數(shù)據(jù)等。
醫(yī)療科研
在醫(yī)療機(jī)構(gòu)中,病例數(shù)據(jù)作為最需要保護(hù)隱私安全的數(shù)據(jù),對醫(yī)療科研與病情推斷具有重要的價(jià)值。然而單個(gè)醫(yī)療機(jī)構(gòu)的數(shù)據(jù)樣本不足以支撐大規(guī)模的模型訓(xùn)練,傳統(tǒng)的做法是將病例數(shù)據(jù)匯總、統(tǒng)計(jì)、銷毀,這種操作是極其不安全的。
而在隱私計(jì)算領(lǐng)域,采用多方安全計(jì)算的方式,可以保證各家醫(yī)療機(jī)構(gòu)數(shù)據(jù)不出庫,加密計(jì)算,最終得到統(tǒng)計(jì)結(jié)果。
醫(yī)療科研
銀行金融業(yè)務(wù)
銀行作為傳統(tǒng)金融機(jī)構(gòu)的代表,在科技賦能的進(jìn)化中,必然涉及到與外部數(shù)據(jù)的聯(lián)合建模。銀行也是隱私計(jì)算最可能率先完全落地的領(lǐng)域。
首先,銀行找到存量用戶需補(bǔ)全畫像標(biāo)簽,才能服務(wù)于流失召回、交叉營銷場景,這非常依賴于銀行外部的數(shù)據(jù)。而隱私計(jì)算中的匿蹤查詢可以保證銀行在查詢外部數(shù)據(jù)的時(shí)候,避免用戶信息被緩存。并且,小微企業(yè)貸等對個(gè)人或者企業(yè)進(jìn)行信貸評估的場景,也需要依賴外部數(shù)據(jù)源做聯(lián)合建模評估。
銀行金融業(yè)務(wù)
保險(xiǎn)營銷與定價(jià)
保險(xiǎn)公司從線下發(fā)展到線上獲客,對精準(zhǔn)獲取潛客需求極大,這里的精準(zhǔn)度直接影響觸達(dá)的成本。另外,“定價(jià)失靈”是當(dāng)前財(cái)產(chǎn)險(xiǎn)行業(yè)經(jīng)營面臨的一個(gè)突出問題,主要表現(xiàn)為保費(fèi)不足和未決賠款準(zhǔn)備金不利發(fā)展。之所以會有“定價(jià)失靈”的現(xiàn)象,既有數(shù)據(jù)、模型和精算技術(shù)等方面的“前定價(jià)管理”原因,也有風(fēng)險(xiǎn)識別、核保、承保、銷售、理賠、費(fèi)用管控和準(zhǔn)備金評估等方面的“后定價(jià)管理”原因。隱私計(jì)算可以為保險(xiǎn)聯(lián)合定價(jià)提供多維度的數(shù)據(jù)支撐。
基金管理
在母基金的管理中,我們需要計(jì)算每個(gè)基金的真實(shí)收益情況。而基金的持倉信息是一個(gè)非常重要的私密信息,它代表了基金的價(jià)值判斷和策略導(dǎo)向,也是基金公司的核心機(jī)密。這里的矛盾在于,一方面母基金出于管理需要信息共享,另一方面是基金本身卻需要保護(hù)這些商業(yè)信息,傳統(tǒng)方法必然導(dǎo)致一方的訴求無法得到滿足。使用多方安全計(jì)算,不僅能夠同時(shí)滿足雙發(fā)的利益訴求,甚至可以讓基金信息得到有效的政府監(jiān)管、防止出現(xiàn)市場結(jié)構(gòu)性風(fēng)險(xiǎn),同時(shí)保證商業(yè)信息不被泄露。
大數(shù)據(jù)增值服務(wù)
像運(yùn)營商、SDK廠商、支付廠商等機(jī)構(gòu),在開展業(yè)務(wù)的同時(shí)會積累大量的用戶數(shù)據(jù)。它們通常會成立一個(gè)大數(shù)據(jù)子公司來做數(shù)據(jù)增值業(yè)務(wù)。傳統(tǒng)的API直接調(diào)用和線下聯(lián)合建模的方式已經(jīng)不滿足數(shù)據(jù)安全的相關(guān)要求。隱私計(jì)算技術(shù)也可服務(wù)于數(shù)據(jù)公司的對外服務(wù)平臺,成為數(shù)據(jù)合規(guī)合法輸出價(jià)值的一種解決方案。
廣告平臺聯(lián)合營銷
媒體平臺對廣告主進(jìn)行營銷投放過程中,需要用甲方的用戶數(shù)據(jù)樣本進(jìn)行聯(lián)合建模,傳統(tǒng)的標(biāo)簽畫像篩選更多地是憑領(lǐng)域經(jīng)驗(yàn),通過機(jī)器學(xué)習(xí)建??梢蕴岣郀I銷的ROI。聯(lián)邦學(xué)習(xí)可以滿足在廣告主的數(shù)據(jù)不出庫的前提下,得到營銷投放模型。
廣告平臺聯(lián)合營銷
供應(yīng)鏈金融
對供應(yīng)鏈上下游企業(yè)而言,如何構(gòu)建一個(gè)信息對稱共享、核心企業(yè)信用價(jià)值可傳遞、商票可拆分流程是一個(gè)挑戰(zhàn)。廠商可以基于區(qū)塊鏈和密碼學(xué)算法,提供金融資產(chǎn)數(shù)字化驗(yàn)證的方案,使企業(yè)能夠?qū)⑵髽I(yè)應(yīng)收賬款進(jìn)行數(shù)字化資產(chǎn)登記,形成不可篡改的數(shù)據(jù)記錄,并實(shí)現(xiàn)實(shí)時(shí)信息共享。
同時(shí)通過參與方分布式賬本,參與方可以得到資產(chǎn)確認(rèn),將企業(yè)信用轉(zhuǎn)化成數(shù)字資產(chǎn)。此外,審計(jì)入口也能方便監(jiān)管機(jī)構(gòu)審計(jì)和查看平臺的資產(chǎn)交易情況。最重要的是,在傳統(tǒng)區(qū)塊鏈只能保證數(shù)據(jù)的不可修改性,通過多方安全計(jì)算和零知識證明等加密技術(shù),可幫助區(qū)塊鏈實(shí)現(xiàn)智能合約的公開審計(jì)確認(rèn)能力與實(shí)際數(shù)據(jù)保密性的分離,讓企業(yè)不再擔(dān)心核心商業(yè)信息的泄露。
高??蒲?/p>
高校的許多研究課題會脫離企業(yè)的真實(shí)數(shù)據(jù)實(shí)驗(yàn)環(huán)境,而聯(lián)邦學(xué)習(xí)既能讓高校科研使用企業(yè)真實(shí)數(shù)據(jù)進(jìn)行課題研究,又可以保護(hù)企業(yè)業(yè)務(wù)數(shù)據(jù)不對外輸出。這對企業(yè)和高校聯(lián)合培養(yǎng)人才、挖掘科研價(jià)值具備促進(jìn)作用。
量化投資模型
除了leval2等傳統(tǒng)的交易所數(shù)據(jù),量化投資領(lǐng)域更大的價(jià)值是通過互聯(lián)網(wǎng)大數(shù)據(jù)的挖掘得到異類指標(biāo),這些指標(biāo)通常被訓(xùn)練成投資決策模型。傳統(tǒng)的私募基金通常將數(shù)據(jù)采購到本地,或者在數(shù)據(jù)服務(wù)端進(jìn)行模型訓(xùn)練,這種方式的弊端是會造成投資模型的數(shù)據(jù)源側(cè)安全性問題。
聯(lián)邦學(xué)習(xí)可以將多方有價(jià)值的數(shù)據(jù)進(jìn)行聯(lián)合建模,訓(xùn)練出綜合的決策模型,而模型實(shí)施部署采用分布式加密的方式,任何一側(cè)的合作數(shù)據(jù)源都無法獲得完整的原始數(shù)據(jù)。
總結(jié)
用戶隱私安全是社會生產(chǎn)力發(fā)展到一定階段的必然產(chǎn)物。當(dāng)前很難回答隱私計(jì)算的具體市場規(guī)模,但在理想狀況中,隱私計(jì)算的應(yīng)用場景存在于幾乎所有需要多方使用數(shù)據(jù)的地方,以上提到的企業(yè)和機(jī)構(gòu)都需要數(shù)據(jù)合規(guī)分享的技術(shù)來協(xié)助業(yè)務(wù)開展。