0 引言

隱私計算作為一種助力實現“數據可用不可見”的關鍵技術,在近幾年受到了越來越多的關注,相關技術產品百花齊放、行業生態建設如火如荼。從技術發展的角度看,隱私計算之所以如此火熱,主要在于它改變了傳統的數據流通形態,增強了數據流通的可控性,在一定程度上回避了數據權屬與安全保護爭議,為數據要素流通提供了新模式[1]

在推廣隱私計算落地應用的過程中,不同技術廠商提供的產品和解決方案在設計原理和功能實現之間存在較大差異,使得部署不同技術平臺的數據流通參與方之間無法跨平臺完成同一個計算任務。為實現多個合作方之間的數據融合,用戶往往要付出極高的溝通成本以協調產品選型方案,甚至不得不部署多套產品以逐一適配,造成重復建設。

作為促進跨機構間數據共享融合的關鍵技術,隱私計算有望成為支撐數據流通產業的基礎設施,但高額的應用成本不利于隱私計算技術的推廣應用,解決不同產品之間的技術壁壘,實現隱私計算跨平臺間的互聯互通已成為產業內的迫切需求。推進隱私計算的跨平臺互聯互通需要關注哪些問題和要點?本文擬從以下六個方面展開討論。

1 隱私計算跨平臺互聯互通的需求

數據資源只有經過“流通”,脫離了原有使用場景,從數據產生端轉移至數據應用端,并在生產經營活動中產生效益,才能真正釋放其作為生產要素的市場價值[2-3]。在數據權屬界定規則缺失、安全合規風險加劇的當下,眾多數據從業者選擇隱私計算作為探索數據流通新模式、新形態的突破口。隱私計算已經成為了當前數據流通領域最火熱的一類技術,但在技術推廣的過程中,不同隱私計算技術平臺之間無法互聯互通成為了制約產品落地應用的一個關鍵阻礙。

1.1 助力多方數據融合降本增效的市場用戶需求

作為一類助力數據流通的工具,產品的可用性、易用性、好用性決定著隱私計算技術價值發揮的范圍和程度。在此前幾年的時間里,國內技術提供者們已經在提升產品的可用性和易用性方面取得了一定的進展。根據中國信息通信研究院云計算與大數據研究所和隱私計算聯盟工作中的調研交流和產品評測結果[2],可以發現在算法、算力、硬件的協同優化之下,行業內整體的技術產品性能已可以滿足用戶業務的基本需求,并且還將持續優化以促進隱私計算在更多需求場景中可用;同時,越來越多的技術廠商可以提供多版本、輕量化等方式來提升用戶部署的便捷性,并配合模塊自定義、組件拖拉拽等設計來滿足用戶的個性化需求,提高產品的易用性。

進一步地,在如何提升產品好用性、促使產品與用戶實際業務場景友好適配這個層面,隱私計算技術平臺之間的互聯互通就成為了關鍵話題。目前,市場上已經發布了近百款隱私計算產品,且仍有許多企業和機構正在研究和開發。而不同產品均有各自特定的算法原理和系統設計,產品之間(甚至同一產品的不同版本之間)的技術差異使得彼此很難兼容、無法互通。因此,參與聯合計算的用戶只能在部署相同產品的情況下才能實現多方數據合作。為了滿足這一條件,單一用戶往往要部署多套產品以滿足不同合作方的需求,這極大地增加了用戶的使用成本,也阻礙了隱私計算技術的推廣落地。

1.2 打造數據流通基礎設施關鍵底座的產業需求

跨行業、跨機構的數據融合在金融、電信、醫療、政務、廣告營銷、智慧城市等諸多場景都有著廣泛的需求。但由于國內對于數據流通使用的監管要求趨嚴,且尚未出臺具有指導性的實施細節指引,相關企業和機構參與數據流通時既有顧慮也有困惑,無疑阻礙了數據資源的充分流通,不利于數據要素市場的培育。而隱私計算技術正在以一種不交互原始數據,只流通數據使用價值的方式,推動著傳統數據流通模式和流程的變革,有望成為全社會數據流通網絡的支撐型基礎設施。但是現階段,隱私計算整體的技術能力和應用模式還不成熟,實現目標仍有距離。

以當前在金融場景的應用模式為例,金融機構往往都需要依靠多方來源的外部數據來支撐其對于諸多業務的風險控制,這些外部數據可能包括專業數據服務商提供的公共市場信息、政府公共部門提供的客戶基礎信息、征信機構提供的客戶征信數據以及運營商、互聯網平臺、電商平臺等提供的更多替代數據等。參與其中的銀行、運營商等大型機構很多已經部署或開始試點各自的隱私計算平臺,面對多機構之間的數據資源合作需求,往往會在反復溝通后由相對強勢的機構要求使用特定的隱私計算平臺進行合作。

以此類推,如果在各個應用場景中,合作機構之間都要就使用特定技術產品達成共識,長此以往,市場就會衍生出一個個基于相同的隱私計算平臺捆綁形成的小生態,而各個生態之間仍舊相互孤立。那么,隱私計算在破除機構間“數據孤島”問題后,將催生一個個新的“數據群島”,與技術本身促進數據流通的使命相背離,無法支撐建立面向全社會的數據流通網絡。

因此,隱私計算平臺之間的互聯互通已成為技術產業進一步發展中亟需解決的問題。

2 隱私計算跨平臺互聯互通的內涵

解決隱私計算跨平臺互聯互通問題的核心基礎,是理解它的概念內涵。

(1)什么是“互聯互通”? 這個概念最早是美國電信領域在1934年提出的,本意是兩個通信網絡之間是否能夠兼容,而在當下這一概念逐漸演變為不同組織、不同場景、不同系統之間在平臺“互操作”與數據“可攜帶”等方面的問題。

(2)互聯互通的客觀對象是什么? 隱私計算跨平臺互聯互通的最根本需求來自于部署了不同產品的用戶,這里的“不同產品”既可能是不同技術廠商提供的多個產品,也可能是相同廠商相同產品的不同版本。進一步地,與其說是不同產品間互聯互通,不如說是用戶部署不同技術產品后的一個個平臺實例。

(3)互聯互通的目標形態是什么? 用戶的最終訴求是希望在部署不同產品后,仍可以實現各自持有的數據在不同底層技術平臺之前間仍可以流暢傳輸、交互、融合,協同完成計算任務。因此,隱私計算跨平臺互聯互通的目標形態是具有不同系統架構或功能實現方案的隱私計算技術平臺(包括同一平臺的不同版本)之間通過統一規范的接口、交互協議等實現跨平臺的數據、算法、算力的互動與協同,以支持部署不同技術平臺產品的用戶共同完成同一隱私計算任務。相比之下,實踐中部分針對多個不同產品之間部署于統一大平臺以支持用戶靈活選擇任一產品執行任務的探索,更貼近于對于不同提供方隱私計算能力模塊的集成,而非真正的跨平臺互聯互通。

3 隱私計算跨平臺互聯互通的難點

隱私計算技術原理本就復雜,而異構隱私計算平臺間的互聯互聯不僅要能夠實現復雜的隱私計算原理,保證平臺原有功能的實現,還要提供足夠的包容性,考慮到不同平臺設計的復雜差異。

3.1 不同隱私計算核心技術路線之間存在天然壁壘

隱私計算并非一項單一技術,而是一個包含多種技術的復雜體系。例如,以密碼學為核心原理的多方安全計算類產品、以安全硬件為核心原理的可信執行計算類產品和以“數據不同模型動”為核心思想的聯邦學習類產品之間,技術實現的最底層思路就有著天壤之別,這種技術上的差異性為現階段討論隱私計算互聯互通帶來巨大挑戰[4]

3.2 算法的實現方案復雜多樣

隱私計算最核心和最關鍵的就是算法,但每個算法在從設計到實現上經過多個環節,涉及諸多細節。在基礎原理上,即使是同一算法從實現原理上也可能有多種不同的實現方案。例如,基于不經意傳輸和基于同態加密的方案都是從密碼學原理出發的,但實現方案卻無法兼容。在工程優化上,對于同一密碼學協議下的相同算法,不同的設計者也可以選擇不同的加速器進行優化,差異依然明顯。進一步地,在不同的計算架構設計下,計算方數量也會不同,是否由中間協調方參與、計算方和數據方之間是否獨立也會對算法執行產生不同影響。

3.3 不同技術提供者在平臺應用管理的設計各不相同

除了核心算法之外,一套完整的隱私計算平臺還包含資源授權、任務管理、任務編排、流程調度等相關的控制管理功能,且不同平臺整體的系統架構也是結合各自的研發思路和應用側重來設計實現的,跨平臺任務的執行需要適應不同平臺的這些設計。因此,基于不同隱私計算平臺共同完成同一計算任務,就必須要解決基礎功能和算法實現如何在不同平臺上兼容和適配的問題。

3.4 技術提供者之間相互適應的驅動力不足

除了技術產品設計本身的復雜性之外,技術提供者們的驅動力不足也會對實現互聯互通產生障礙。無論是技術路線的選擇、核心算法的設計和基礎功能的實現,都是各個隱私計算技術提供者最核心的設計思想和知識產權,實現互聯互通的過程中勢必會存在一定的相互遷就與妥協,損失產品原有的個性化。現階段,在隱私計算的應用探索仍在推進,用戶增量不斷,因此在進入存量競爭之前,跨平臺互聯互通對于技術廠商而言并非“剛需”。因此,已有的探索實踐大多是用戶側推動的。

4 隱私計算跨平臺互聯互通的實現路徑

4.1 隱私計算跨平臺互聯互通應滿足的特性

考慮到現有隱私計算技術產品之間存在較大的差異性和商業驅動力的現狀,若要實現不同技術產品間的協同,就不能要求所有產品同質化、統一化,必須尊重各平臺本身的設計思路和理念,在保證各隱私計算技術平臺的獨立性、完整性和安全性的基礎上對實現互聯互通的最基礎環節求同存異。因此,隱私計算跨平臺互聯互通的實現方案應該滿足以下特性。

一是互通性。即不同技術平臺間應支持通用、規范的通信接口和互聯協議,能夠進行跨平臺的通信、數據交換、互聯操作和狀態同步。

二是平臺自治性。即各平臺均應為自治系統,保留對各自平臺設計的獨立性和個性化,自主管理平臺內部的任務協同與資源配置,在參與跨平臺互聯互通任務時,無需暴露內部的私有協議、模塊設置和架構細節。

三是正確性。即跨平臺互聯互通完成的隱私計算任務與各平臺獨立完成的隱私計算任務結果保持一致,或偏差在不影響應用的范圍內。這是隱私計算技術產品的最基礎的功能要求。

四是安全性。即不同平臺間的交互和協同應通過統一的安全通信機制、認證與授權機制、安全模型假設等保障跨平臺互聯互通的通信安全、應用安全、算法協議安全。這是隱私計算技術產品的最關鍵的應用要求。

五是易擴展性。即不同平臺間的互聯互通應支持較為靈活的加入或退出,可以隨著技術發展適配更多新的隱私計算功能實現方案,實現有機擴展。這要求互聯互通方案能夠包容和應對未來技術發展帶來的挑戰。

4.2 隱私計算跨平臺互聯互通的實現思路

而具體如何實現互聯互通,可以對其他技術或行業應用場景中的互聯互通經驗進行參考和借鑒。比如互聯網數據傳輸場景中的TCP/IP協議、銀聯銀行卡跨行交易的通用報文協議、國內外物聯網的跨平臺接入協議等都是通過制定系列標準化的協議,約定不同的設備如何組織和接入同一網絡并進行數據交互。其中,互聯網通過多層次的協議設計連接多設備、多網絡的成功經驗可以為通過隱私計算串聯起的數據流通網絡提供較多參考,隱私計算跨平臺的互聯互通也可以拆解成底層的通信、逐步上升到傳輸交互和頂層應用,通過逐層定義共識性的技術標準,最終實現規范流暢的跨平臺協作。

以相關經驗為參考,隱私計算跨平臺互聯互通的實現路徑可以從“底層通信—中間層交互—頂層應用”的思路出發進行設計。通信層需對平臺間選擇的通信框架、通信接口、數據格式、傳輸機制等內容進行規范;交互層可以從節點、資源和算法執行三個維度進一步約定在跨平臺交互過程中在發現、認證、申請、授權、連接調用、信息和狀態同步等環節的規范流程和要求;而應用層則是在規范通信要求和互聯協議棧的基礎上定義跨平臺隱私計算任務實現過程中的協同管理要求和具體場景的實現流程,既包括對跨平臺任務編排、調度、執行、監控和存證等方面的統一規則,也包括不同類型計算任務的實現流程的約定。

5 隱私計算跨平臺互聯互通的探索進展

自2021年開始,很多隱私計算技術提供者和應用側都開始推進跨平臺互聯互通的嘗試,提出了不同的思路和方案,也取得了一定的進展。

中國電信翼支付的隱私計算技術團隊通過引入中間件和區塊鏈智能合約的方式實現了自研Priv Torrent隱私計算平臺和FATE開源框架的對接[5]。基于中間件對交互過程中報文的轉換實現異構平臺節點識別、算法數據報文重構、任務事件轉發和任務狀態同步;基于區塊鏈的智能合約實現兩個平臺間底層通信、交互標準以及報文分類和內容(包括過程數據、任務狀態和執行結果)的統一。這個方案提供了一種相對低耦合、易擴展的解決思路,中間件可以靈活部署在任意節點,而區塊鏈可以進一步地支持對任務的審計溯源。但是這一方案也存在局限性,一是平臺的原生內核限定在FATE框架,二是需要以隱私計算與區塊鏈的耦合作為前提。

富數科技和微眾銀行在2021年4月宣布突破了隱私計算跨平臺、跨架構的互聯互通難題,雙方團隊按照認證、管控、計算三個主要流程,抽象出節點、數據、算法組件、計算任務、存證、認證六大對象模型,提出了從節點互相發現、資源互相共享到算法組件跨平臺遷移部署再到計算任務跨平臺執行的三階段思路。類似于這一思路,洞見科技、锘崴科技和螞蟻集團共享智能部在2021年8月宣布聯合攻關完成了具體互通協議流程的架構設計和落地實現。在第一層次統一了節點發現、業務流程對接、資源信息定義和管理的規則之上,進一步實現了三個平臺各自獨立設計和開發的算法插件可以直接在另兩方的平臺上運行,并與其他參與方協同完成計算任務的執行和結果輸出。這類方案無需引入中間件或其他系統,可以較大程度地保留各自平臺算法功能的獨立設計,與本文討論的實現路徑基本一致,但是除了算法功能之外,各個技術提供者對于底層通信框架、上層工程化方案的設計仍有諸多堅持,若要取得大范圍的行業共識仍有較大難度。

除了以上實施案例之外,華控清交與星云Clustar、矩陣元、沖量在線等技術廠商也宣布建立戰略合作探索隱私計算跨平臺互聯互通。參考互聯網中自治系統、邊界網關協議和TCP/IP協議的設計思路,華控清交提出了一種定義跨域數據交換(Inter-Domain Data Exchange,IDDE)協議實現互聯互通的思路。將不同的隱私計算平臺視為獨立的自治系統(AS),并參照TCP、UDP和IP協議向上可滿足多類應用、向下可兼容多種底層物理通信機制的思路,來規范IDDE中的核心協議。其中,IDDE協議包含控制面、數據面兩部分,控制面對節點、資源的信息和任務調度、存證等內容進行規范;數據執行層則負責規范在各隱私計算平臺中執行已編排的計算過程。

6 隱私計算跨平臺互聯互通的未來推進思路

當前,從標準體系層面對利用隱私計算跨平臺互聯互通的具體方案進行規范勢在必行,包括中國信息通信研究院云計算與大數據研究所牽頭的隱私計算聯盟、大數據技術標準推進委員會(TC601) 、全國信息安全標準化技術委員會(TC260)、京金融科技產業聯盟等在內的標準化組織和研究機構都在推進相關技術標準的研討和編寫。

但是,隱私計算的跨平臺互聯互通不只需要在技術層面進行攻關,更需要在商業層面繼續突破。因此,相關標準規范體系不能只停留在標準文稿制定層面,等待由統一的規則指導實施,還必須從實踐中汲取經驗,推廣運營事實標準,由正式標準在原則要求層面對事實標準進行引導,由事實標準從實際業務場景中對正式標準進行細化完善,雙管齊下,最終在技術方案選擇、跨平臺協同和具體應用實施的各個環節給出具有普遍共識的、可落地執行的細節指引。

7 結束語

現階段,隱私計算技術發展尚未完全成熟,對于如何將復雜的技術原理轉化為商業化的產品實現已經是百家爭鳴,而對于如何將不同技術方案串聯起來協同應用于數據互聯互通的實際場景,仍有眾多觀點在持續探討。在技術發展過程中,只要行業保持對于各類觀點思路的開放包容,并堅持通過廣泛交流和探索來挖掘最佳實踐,相信隱私計算的跨平臺互聯互通難題也能盡快得到突破。