基于隱私計算的數據流通平臺互聯互通思考 - 網安 - 專業的網絡安全產業、社區、知識平臺

在國家數據要素化戰略影響下，金融業積極探索隱私計算應用。不少金融機構已部署隱私計算平臺，促進了一定范圍內的數據融合使用。但不同平臺往往存在較大技術差異，很難進行互聯互通。目前行業對平臺間互聯互通的探索還是小規模、個性化的“抱團”現象，其模式能否真正實現更廣泛的互聯互通尚值得推敲。

本文著眼于整個金融行業的數據要素流通，基于當前熱度比較高的多方安全計算、聯邦學習等隱私計算技術應用現狀和互聯互通情況，借鑒成熟的互聯網體系架構，提出了隱私計算平臺互聯互通的一些基本設計思路和建議。

隱私計算平臺互聯互通的內涵

一個通過隱私計算技術實現的數據流通平臺（簡稱隱私計算平臺）一般基于某種信任機制被組織起來，且具有一定的自治權利。這些權利經常包括：自主選擇、管理成員；制定適合平臺內的數據流通規則；接受某一個或多個監管方的監管；根據業務選擇某一種或多種隱私計算技術。

要實現不同隱私計算平臺間的互聯互通，首先應該保證每個平臺的自治權利。但目前業界對跨平臺互聯互通存在一些誤解，例如：（1）數據源在多個平臺上注冊。這與數據跨平臺流通沒有關系。（2）平臺收編。這不符合自治的原則。（3）平臺上的原始數據直接流通到另一個平臺上去。這等同于第一種理解。

因此，可定義平臺之間的互聯互通是把一個平臺上數據融合的中間結果（也稱計算因子，參考JR/T 0196《多方安全計算金融應用技術規范》）跟另一個平臺上數據融合的中間結果進行再次計算，從而獲得進一步結果的過程。類似于隱私計算在單平臺上實現了“數據可用不可見，使用可控可計量”，在這個過程中，需要保證每個平臺上的原始數據不外泄，且平臺自身仍然對各自的數據源保持控制權。此時，平臺相當于數據提供方，提供的計算因子反映了對數據的某種特定使用方法，也應遵循數據提供的“最小化”原則。不同平臺間的互聯互通應該能夠通過建立鏈接，讓數據源有機快速增長，并通過分散式協作，降低數據中心化匯聚造成的額外安全風險，推動隱私計算技術的百花齊放。

當前，平臺間互聯互通的難點在于各平臺的異構性。如各平臺的信任基礎不一樣,包括對管理的信任和對技術的信任，或平臺之間的身份認證體系不統一，以及各平臺使用的技術方案和技術原理不相同等。另外，考慮到市面上已有眾多不同的隱私計算產品和應用成果，達成了管理、技術和商業模式上的信任共識，互聯互通不應是改變已部署平臺的信任共識，更不是平臺替換，而是在已有平臺上疊加可管可控的跨平臺功能，實現數據跨平臺流通時的“可用不可見”和“可控可計量”。從技術角度看，互聯互通實際上可認為是隱私計算平臺的一種遞歸式擴展。

隱私計算平臺互聯互通設計思路

從信息科技發展歷程來看，互聯網（Internet）可以說是當今世界上最成功的技術架構之一。其使用一組體系化的協議將設備與設備、網絡與網絡連接起來，造就了世界上跨度范圍最廣的應用案例。筆者認為，互聯網相關設計理念與本文討論的互聯互通問題高度契合，主要包含了控制面和數據面兩大類協議的設計思路。

1.控制面：自治系統與邊界網關協議

互聯網發展初期面臨不同類型設備或獨立網絡之間的互聯問題，與隱私計算平臺的異構性類似。在互聯網路由協議中，對于被統一管理、采用相同通訊策略的集合，視為一個自治系統（Autonomous System，AS）。自治系統可自主決定其內部允許連接哪些設備、采用哪種網絡技術和路由策略，而對于自治系統之間的連接則可采用外部路由協議——邊界網關協議（Border Gateway Protocol，BGP）。BGP是一種提供AS間路由選擇的協議，其本身不主動發現AS內部路由，而是在確定最佳路徑時側重于根據不同屬性控制數據流的傳輸。

參考這一設計思路，每個隱私計算平臺內部各方依據自治原則協同執行內部計算任務，也可視為一個AS。平臺間通過統一的、兼容并包的外部接口（可將其稱為跨域數據交換Inter-DomainDataExchange，IDDE）實現相互連接，既保證了每個平臺的內部自治，又統籌各個平臺的資源，協調完成計算任務。

2.數據面：層次化設計與“沙漏”模型

層次化設計是互聯網協議中最常用的思路，其典型案例是TCP/IP協議（Transmission Control Protocol/Internet Protocol）。TCP/IP協議的核心在于中間的傳輸層和網絡層，即通過TCP、UDP和IP等一組輕量、精巧的協議，向上服務HTTP、FTP、SNMP、DNS等多種多樣的互聯網應用協議，向下將IP包通過路由器處理、轉換和重新封裝到各種底層網絡的物理幀中，并支持光纖、電纜、無線、衛星等不同的通信傳輸方式，整體呈現為一個“沙漏”狀結構。

圖1 “沙漏”模型

隱私計算平臺在實現上一般也采用層次化結構，不同平臺在頂層應用和底層技術的選擇上都是多樣化的。其中，頂層覆蓋金融行業常見的隱匿查詢、聯合統計、聯合建模等豐富的應用層算法，并用于智能風控、精準營銷、信用認證等多種場景。而底層則包括各類隱私計算技術，例如沙箱、多方安全計算、聯邦學習等，其目的都是為了流通數據特定使用方式（計算因子）。因此，可以在“沙漏”的瓶頸處設計和構建“隱私路由”，完成計算因子在多樣的應用場景和豐富的技術類型間的相互轉換。

3.控制面與數據面解耦

綜上所述，從控制和數據兩個切面來設計、實現隱私計算平臺間的互聯互通，控制面負責資源管理、安全管理以及任務管理等工作，包括資源目錄同步、計算合約達成、跨平臺身份認證、密鑰管理、任務執行調度與流程管控等；而數據面則依照計算合約，執行數據、算法等資源的接入、同步和格式轉換，協同、高效地完成計算任務。數據面和控制面協議之間在技術實現上可以是完全解耦的，在保證互聯互通的情況下，允許采用不同的設計思路和實現架構，從而降低實踐難度，避免技術壟斷，促進技術多樣發展和高速創新。

圖2 控制面與數據面

結論及建議

1.循序漸進推動標準化與檢測認證體系

基于上述思路，推動互聯互通落地需要統一的標準化和檢測認證體系。首先，標準化工作應該依據技術研發和監管要求的發展，循序漸進地向前推進，建議先定義關鍵核心層技術要求，積極研究開源開放的跨域數據交換協議（IDDE）技術框架，再根據實際情況向頂層和底層拓展，逐步構建一整套互聯互通標準體系。其次，建議依據相關標準要求建立檢測平臺和認證體系，明確平臺互聯互通能力評估方法，為金融機構提供選型依據，不斷提高行業內數據流通水平。

2.建設數據流通網

《全國一體化大數據中心協同創新體系算力樞紐實施方案》指出“加強跨部門、跨區域、跨層級的數據流通與治理”，并把“加快網絡互聯互通”作為建設國家樞紐節點的重點任務之一。因此，互聯互通的目標不是構建幾個平臺或者幾個機構間的“局域網絡”，而是要成為面向全行業、全國，建設“數據流通網”的基礎設施。依據本文設計思路，隱私計算平臺（自治系統AS）間可通過統一的IDDE相互連接、組成隱私計算網絡，而每個網絡自身又構成了一個自治系統AS，網絡與網絡間也可以通過IDDE再組合起來。由此可見，金融行業各隱私計算平臺之間能夠相互組合、不斷擴展，支持隱私計算網絡持續迭代、有機生長，為響應國家政策號召、建設國家級數據流通網邁出標志性一步。