<menu id="guoca"></menu>
<nav id="guoca"></nav><xmp id="guoca">
  • <xmp id="guoca">
  • <nav id="guoca"><code id="guoca"></code></nav>
  • <nav id="guoca"><code id="guoca"></code></nav>

    ?商業銀行隱私計算平臺建設思考

    VSole2021-10-26 06:23:59

    隨著數字經濟的深入發展,數據作為關鍵生產要素的作用逐漸凸顯,同時,《數據安全法》和《個人信息保護法》等法律法規的頒布實施,對數據安全和隱私保護也提出更高要求。隱私計算是保護數據特定使用權跨界流通應用的新興技術,可以在密文狀態下完成規則及模型的計算,保護數據和隱私的安全。商業銀行一直是信息化的引領者,同時也是數據密集型行業,目前隱私計算技術在商業銀行的落地應用趨勢已越來越明確。

    商業銀行數據流通的需求及特點

    對商業銀行來說,數據的作用集中體現在業務風控(生產過程,包括交易風控和信貸風控)和精準營銷(流通過程)。目前銀行數據跨界應用存在以下特點。

    1.依賴外部數據進行業務風控和精準營銷

    銀行業務依賴大量的內外部數據,自有內部數據有很高的金融價值屬性,并引入如運營商、司法、稅務等外部數據提升風控和營銷的效果。2021年7月央行要求實現個人信息“斷直連”,應考慮通過征信公司間接接入數據源。

    銀行數據向外流通的場景較為有限,主要流向關聯方或服務供應商。應考慮在不影響業務的前提下使用隱私計算技術保護輸出的數據。

    2.算法和模型要滿足安全性和可解釋性的要求

    銀行使用數據主要用于自動化決策,自動化決策需要模型的支持,模型分為人工定義模型和機器學習模型。法律法規(《個人信息保護法》明確要求自動化決策結果對個人權益有重大影響時要能說明清楚原因)、監管機構、消費者權益保護及自身風控等對算法和模型的安全性及可解釋性提出要求。2021年3月央行發布并實施《人工智能算法金融應用評價規范》,要求應用AI算法需滿足安全性和可解釋性的要求。

    3.多數據源應用要求標準規范及產品技術上的互聯互通

    數據跨界天然要求互聯互通,銀行多數據源的特點導致銀行對標準規范和產品技術互聯互通的訴求更為強烈,整體互通包括節點互通、管理互通和算法互通。隱私計算由于技術難度及場景適應性等原因,互聯互通的難度和節奏都不一樣,應該分開考慮,區別對待。

    隱私計算的技術路線及發展趨勢

    根據現有市場分類,隱私計算主要分為基于密碼學的多方安全計算(MPC)、基于可信硬件(TEE)的機密計算(CC)和聯邦學習(FL)三個技術方向。基于可信硬件的機密計算方案需要依賴國外的硬件設備,存在重大安全隱患,因此在國內屬于非主流方向;聯邦學習的主要目標是融合MPC、TEE、AI及傳統密碼技術,訓練更好的AI模型,為了提高效率,部分方案安全證明不嚴格,受到一定質疑;多方安全計算有嚴格的理論基礎且圖靈完備,有廣泛的應用空間,執行性能成成為詬病的主要因素。

    隱私計算是計算理論、信息論、密碼學等學科的綜合應用,相關技術不斷快速發展變化,具體來說有以下現象和發展趨勢:

    1.多方安全計算理論和技術不斷發展

    多方安全計算適應各種計算任務。近年來,秘密分享、混淆電路等通用技術以及隱私交集、匿蹤查詢等專用技術的優化算法和加速方案不斷迭代,滿足多種場景的商用需求。同時惡意模型、隱私度量、可驗證計算等新技術在快速發展,未來更好支持數據要素跨界流通,實現最小化信息損耗,最大化數據價值。

    2.開源的聯邦學習項目逐步成熟

    機器學習的目標函數(損失函數、梯度算法)比多方安全計算(任意計算)簡單,但計算過程和輪次復雜。聯邦學習解決機器學習的隱私保護問題,分為橫向、縱向和遷移,橫向是設備聯邦,縱向是機構聯邦,銀行應用以縱向聯邦為主。聯邦學習開源框架已比較成熟并逐漸形成主流,相關技術門檻會逐漸降低,大型商業銀行應考慮在成熟框架上自研,從聯合開發起步,長期支撐業務發展。

    3.國產TEE技術成熟尚需時日

    TEE技術雖然在性能上有優勢,但由于成熟產品以國外廠商為主,國內TEE技術還在發展過程中,需持續跟進觀察。

    商業銀行隱私計算平臺建設建議

    近年來商業銀行開始隱私計算技術的布局和研究,部分銀行著手試驗性的隱私計算平臺建設,關注重點各不相同。銀行隱私計算技術布局建議如下。

    1.從實際應用場景出發,兼顧多方安全計算和聯邦學習并快速落地

    隱私計算技術在不斷發展過程中,希望一個技術、一個平臺、一勞永逸解決所有問題是不現實的。多方安全計算通用性更好,而聯邦學習處理非結構化的數據更有效,銀行的重點是業務,應堅持實際業務場景出發,多方安全計算和聯邦學習并重,更靈活的適應各種業務場景。

    2.選擇合適聯邦學習框架,合作開發并逐步開始自研和互聯互通建設

    聯邦學習開源框架已比較成熟,銀行可根據自身業務需求選擇合適的框架,跟合作伙伴聯合開發快速落地,并逐步配備相關資源自研。伴隨聯邦學習框架集中度不斷提高,互聯互通的難度會越來越低。

    3.與技術實力強的廠商合作,不斷應用多方安全計算及相關技術

    多方安全計算的技術壁壘高,技術縱深大,一些關鍵的技術,如全同態密碼、惡意模型、可驗證計算、不可區分混淆等技術均在快速發展中,銀行應選擇在技術實力強的廠商長期深度合作。

    4.考慮外部數據源接入的效率和維護成本

    商業銀行擁有強大的科技和運維團隊,外部數據源不一定具備同等能力,如何實現快速接入,如何降低開發運維成本是需要重點考慮的問題。銀行自身隱私計算平臺可考慮集中建設,數量眾多的外部數據源應采用互聯互通、方便維護的硬件一體化產品,降低開發、部署、接入和運維難度。

    商業銀行隱私計算技術選型建議

    選擇合適的合作伙伴是銀行隱私計算技術落地的關鍵點之一。隱私計算作為密碼安全技術且面臨各種各樣的應用場景,對密碼、安全以及業務要有深入理解,選擇有金融行業服務經驗的廠商和團隊至關重要。具體來說,可考慮以下要點來甄選廠商。

    1.計算框架、整體安全及選型測試方案

    隱私計算產品首先是一個安全產品,不能忽視整體安全功能,包括密鑰管理、訪問控制、接入鑒權、通訊安全、系統安全等。應優先選擇具有長期的銀行相關安全產品服務經驗的合作伙伴,廠商應具備質量體系、信息安全管理體系等安全認證,產品應經過公安、國測等權威第三方安全檢測機構測試和認證。

    隱私計算性能開銷包括計算、通訊和交互輪次開銷,通常提及計算和通訊開銷,對交互輪次開銷關注較少。前者可通過增加計算資源和通訊帶寬等緩解,交互輪次的開銷是不可解的。銀行風控等業務有實時性響應要求,并且數據源多通過廣域網連接,交互輪次對響應時間影響更加突出,在局域網測試表現很好的方案和產品不一定實際可用。因此選型測試方案和測試環境應充分考慮上述因素。

    2.基本隱私算子原理及選型要點

    由于混淆電路、秘密分享、同態密碼等通用隱私計算技術是從電路層面解決問題,因此基本隱私算子主要包括加法(比特即異或門)、乘法(比特即與門)和比較(相當于電路中高低電平狀態判斷),對基本算子要考慮:

    ① 算法原理安全論證:安全性有問題,性能再好也是沒有意義的;

    ② 算子安全靈活組合:單個算子是無法保護隱私信息;算子安全組合(即由電路門組合成計算電路)可達到除結果外不泄露中間信息的目標。基本算子輸出支持密文狀態(分片或加密)才能實現安全組合;算子組合有三種結構:順序、選擇和循環,應有安全合理的方案支持上述組合;

    ③ 正確性、精度和性能:選型需關注計算結果正確性和計算精度,不同精度對性能影響是不一樣的。

    3.專用隱私算子原理及選型要點

    專用隱私算子主要包括隱私交集、匿蹤查詢和不經意傳輸。每種專用算子也都有多種不同的理論及算法,依賴不同計算環境,測試注意事項及要點具體如下:

    ① 隱私交集(PSI):隱私交集實現包括Hash、DH、OT等方案,可設定多種場景,在安全性和正確性的基礎上,比較性能(包括CPU、內存、帶寬和交互輪次)和靈活性(是否支持多種輸出方式和算子組合);

    ② 匿蹤查詢(PIR):匿蹤查詢分為保護數據方和不保護數據方兩類方案,應考慮安全性、是否預處理、是否分桶等因素,設計不同測試場景和用例;

    ③ 不經意傳輸(OT):不經意傳輸是高級算子的基礎,也有多種不同理論和算法,設定2選1、多選1等用例,在安全性論證基礎上,比較性能和靈活性。

    4.聯邦學習算法原理及選型要點

    聯邦學習需要考慮訓練階段、模型類別、縱向橫向等支持,互聯互通也是重要關注點。相關測試注意事項及要點具體如下:

    ① 算法原理論證:安全基礎不同,功能、性能不具有可比性,應該對算法原理進行論證和驗證;

    ② 縱向聯邦和橫向聯邦:橫向聯邦相對容易實現,但銀行應用場景更多是縱向,應重點關注縱向聯邦;

    ③ 特征工程:樣本對齊、特征篩選等需要隱私保護,因此也應關注;

    ④ 模型支持:目前常用模型有回歸類模型、決策樹模型、神經網絡模型等,隱私保護下,回歸類和決策樹可以商用,深度神經網絡性能一般,建議目前重點考慮縱向回歸類和縱向決策樹模型;

    ⑤ 互聯互通:國內FATE影響力比較大,可以考慮與FATE的互聯互通測試。

    5.專家規則算法原理及選型要點

    銀行業務對專家規則的依賴比較高,專家規則可能是多種多樣的,需要多方安全計算支持,同時風控類業務對實時響應的要求又比較高,既需要考慮各種規則的隱私度量,又需要考慮如何根據目標函數、數據特點、部署環境、網絡環境和響應時間要求等采用算子組合來實現,還需要考慮算子組合的安全性及如何靈活組合以快速支持業務開發,測試注意事項及要點具體如下:

    ① 隱私度量預算:數據方和使用方都會擔心自身的模型及數據泄露,而隱私計算的理論決定了必然有隱私損耗,因此計算雙方需要做好隱私預算,同時在模型設計、計算中進行隱私度量和預算控制,防范惡意合作方竊取隱私數據;

    ② 隱私規則引擎:應支持圖形化的、靈活簡潔的隱私專家規則設計,設計過程可展示度量信息損耗、度量計算、通訊開銷和響應時間。

    6.預研類技術前瞻布局

    多方安全計算和聯邦學習技術在快速發展變化中,比如新一代的全同態密碼及算法加速、惡意模型、可驗證計算、屬性加密和訪問控制、函數加密、不可區分混淆,這些技術將是隱私計算下一步的發展方向,也將進一步推動數據安全和隱私保護的發展。銀行應該選擇在上述技術上有考慮有布局的合作伙伴,以保持銀行在隱私計算和數據流通上的領先優勢。

    銀行梯度算子
    本作品采用《CC 協議》,轉載必須注明作者和本文鏈接
    隱私計算是保護數據特定使用權跨界流通應用的新興技術,可以在密文狀態下完成規則及模型的計算,保護數據和隱私的安全。
    Python圖像處理第17篇介紹Scharr算子、Canny算子和LOG算子,希望您喜歡!
    圖對抗攻擊
    2022-08-26 08:12:31
    之后大佬提出圖卷積網絡,正式將CNN用于對圖結構數據建模。GCN通過整合中心節點和鄰居節點的特征和標簽信息,給出圖中每個節點的規整表達形式,并將其輸入到CNN中。由此,開啟了GNN研究的熱潮。在GNN受到廣泛關注的背景下,其安全性如何還沒有被探究過。用于隱表示H依賴于鄰接實例,所有的實例都被couple在一起。我們將GNN作為一個單個的隱層:其中,輸出的Zvc表示的是將節點v分類為類c的概率。
    如何攻擊圖神經網絡
    2022-08-24 08:12:18
    目前,圖結構的數據被應用于各種安全敏感領域(例如惡意軟件分析,內存取證,欺詐檢測,藥物發現等),而隨著圖神經網絡的興起,研究人員嘗試將圖神經網絡應用于這類數據上實施分析,發現都能達到非常先進的水平。
    零信任的“問題”
    2022-03-24 18:32:08
    “問題”是一個多義詞,可以理解為負面的意義,如錯誤(Error)、麻煩和困難(Problem)、副作用(Side-effect),也可以理解為開放性的意義,如提問(Question)、題目和課題(Topic)。本文探討零信任的問題,是從宏觀的視角來分析:沒有特別關注零信任的技術細節,重點是試圖追問零信任根本的原理問題;沒有具體討論零信任的實現方法,但是卻希望解構其需求框架。文章重點不在于闡明或立論
    為進一步推動產融合作相關政策落地實施,交流分享產融合作相關經驗,為產業側與金融側搭建更加高效的對接合作平臺
    當前信息化與經濟社會持續深度融合,數據作為關鍵生產要素的作用逐漸凸顯。與此同時,數據泄露事件層出不窮,數據隱私安全面臨巨大的挑戰。在這樣的背景下,《網絡安全法》《數據安全法》《個人信息保護法》相繼出臺,旨在嚴格約束企業的個人信息處理行為。
    雖然聯邦學習因為可以保護用戶的本地數據隱私而備受重視,但其也和其他機器學習架構一樣面臨著一些問題,并且容易受到黑客的攻擊。這對機器學習的廣泛應用來說是一個嚴重的限制性因素,特別是當訓練數據集包含敏感信息并因此構成安全威脅的時候。例如,為了開發核磁共振掃描的乳腺癌檢測模型,不同的醫院可以共享他們的數據來開發協作的機器學習模型。
    近年來,基于大數據和人工智能技術的各項應用已經走進我們生活的方方面面,數據作為其中的基礎性生產要素和戰略性資源,在生產生活中扮演著越來越重要的角色。與此同時,隨著技術發展的不斷深入和應用領域的不斷拓寬,也逐漸面臨一些亟待解決的問題。一方面,單一、少量的數據逐漸不能滿足數據應用的需求,只有數據跨部門、跨業務、跨企業、跨地區的融合應用才能支撐和推動數字經濟創新發展。另一方面,數據安全和隱私保護的關注度
    VSole
    網絡安全專家
      亚洲 欧美 自拍 唯美 另类