<menu id="guoca"></menu>
<nav id="guoca"></nav><xmp id="guoca">
  • <xmp id="guoca">
  • <nav id="guoca"><code id="guoca"></code></nav>
  • <nav id="guoca"><code id="guoca"></code></nav>

    開放環境下大數據安全開發利用的挑戰和思考

    VSole2022-06-20 13:48:04

    摘 要:

    數據作為新型生產要素,與云計算、大數據、人工智能等新興技術深度融合,促進社會生產力以前所未有的速度發展。以數據為基礎資源,我國將數字經濟作為國家戰略進行實施,并強調數據安全是數字經濟健康發展的基本保障。當前的數據環境更加開放,共享利用更為頻繁,數據呈現來源廣、規模大、結構豐富、處理行為多樣、擁有權與使用權分離等特點,針對數據面臨著被惡意竊取、篡改、刪除、非法使用等威脅和技術挑戰,以密碼技術為核心,設計了數據安全基因模型,提出了具有安全存儲、密態利用、全程監管能力的開放環境下數據安全架構,為不同典型場景的數據安全需求提供解決方案。


    內容目錄:

    1 數據開發利用的安全挑戰

    2 數據安全開發利用技術現狀分析

    2.1 安全存儲

    2.2 密態利用

    2.3 數據監管

    3 數據安全開發利用技術架構

    3.1 數據安全開發利用平臺架構設計

    3.2 數據安全流通格式結構設計探索

    3.3 數據安全開發利用平臺系統組成

    4 數據安全開發利用的應用場景

    5 結 語

    隨著云計算、大數據、物聯網、5G 通信、人工智能技術等新興技術的發展和應用,數據已經成為企業和國家的基礎資源,在政府高效治理、企業生產提質增效、市場資源獲取、科技創新等方面發揮了關鍵作用,極大地促進了社會經濟的快速發展。以數據為中心的信息時代已經到來,數據已成為國家戰略資源。2015年 10 月,中共十八屆五中全會首次提出“國家大數據戰略”,旨在全面推進我國大數據發展和應用,建設數據強國,促進經濟轉型升級;2020 年 4 月,中共中央、國務院正式發布了《關于構建更加完善的要素市場化配置體制機制的意見》,首次提出將數據作為生產要素,強調推進政府數據開放共享,加強數據資源整合和安全保護;2022 年 1 月,國務院印發了《“十四五”數字經濟發展規劃》,部署了優化升級數字基礎設施、充分發揮數據要素作用、大力推進產業數字化轉型、加快推動數字產業化、持續提升公共服務數字化水平、健全完善數字經濟治理體系、著力強化數字經濟安全體系、有效拓展數字經濟國際合作 8 項重點任務,目標是實現 2025 年數字經濟核心產業增加值占國內生產總值比重達到 10%;2022 年 1 月,《求是》雜志發布了習近平總書記重要文章《不斷做強做優做大我國數字經濟》,指出發展數字經濟是把握新一輪科技革命和產業變革新機遇的戰略選擇。我國從大數據戰略、數據生產要素等逐漸向數字經濟的國家戰略發展,持續強化了數據的戰略意義。

    數據作為重要的基礎資源,受到世界各國、組織的高度重視。各個組織可以運用先進的數據分析處理技術,收集多來源的海量數據,實施數據挖掘、機器學習等算法,提煉出高價值數據信息。同時,數據是指任何以電子或者其他方式對信息的記錄,其復制成本低、環境容易不受控。由于數據本身具有利用價值且容易被攻擊,因此數據安全問題日益嚴重,危及國家、社會及個人的安全,嚴重時將引發國家威脅、社會混亂、個人財產或生命安全威脅。2019 年9 月,Facebook 公司泄露了 4 億條用戶的賬號、電話號碼等信息,并被美國聯邦貿易委員會罰款 50 億美元;2020 年 4 月,知名的視頻會議軟件 Zoom,在用戶安裝或打開應用程序時收集用戶信息,并因安全防護不到位,導致 1.5 萬個會議視頻遭泄露;2021 年 10 月,江蘇無錫警方成功破獲了一起侵犯公民個人信息案,犯罪嫌疑人非法獲取各類公民信息 54 億多條,并通過非法網絡平臺以查詢、出售等方式牟取利益。可見,國內外每年的數據安全事件頻發。

    為了降低數據安全事件頻發導致的安全危害,確保數據被合理地開發使用,并保證數據經濟健康有序發展,世界各大經濟體相繼制定了一系列數據安全法律法規。2012 年 2 月,美國白宮提出了《消費者隱私權法案》,讓消費者能更好地控制他們留在互聯網上數據足跡的使用、儲存和銷售。2018 年 5 月,歐盟出臺了《通用數據保護條例》(General Data ProtectionRegulation,GDPR),成為歐盟隱私和數據保護的法律框架,要求在歐盟地域內的企業滿足條例的合規性要求。2021 年 6—8 月,我國相繼發布了《中華人民共和國數據安全法》《中華人民共和國個人信息保護法》,規范數據處理活動、個人信息處理活動,保障數據安全,促進數據開發利用和個人信息合理利用,保護個人、組織的合法權益,維護國家主權、安全和發展利益。

    由此可見,數據是企業和國家發展的基礎資源、關鍵資源,數據要素基礎設施建設、數字經濟發展、數據安全防護是世界各國的戰略共識。本文主要聚焦于數據安全利用,分析開放環境下數據安全面臨的挑戰,介紹數據安全技術的發展現狀,設計數據安全開發利用技術架構和系統組成,并簡要提出典型場景下的應用模式。

    1

    數據開發利用的安全挑戰

    數據開發利用過程,也是數據、算法和算力協同發展、持續遞進的過程,其核心是“以數據為資源,挖掘信息價值”。如今,互聯網、物聯網、5G 通信等網絡技術為大規模邊端數據采集提供了可靠手段。云計算技術為數據存儲與處理提供了靈活配置的基礎設施資源池,具備了算力基礎。大數據技術使得大規模數據存儲與處理具備了高效運行和海量數據匯聚融合的能力。人工智能技術為數據智能分析和價值提煉提供了算法能力。整個數據開發利用過程融合了云計算、大數據、物聯網、移動通信、人工智能等技術,貫穿了大規模邊端、云計算設施、大數據中心、智能應用等信息系統,涉及數據擁有方、平臺運營方、數據使用方、監管方等角色。因此,數據環境是一個廣泛開放式環境,并處于頻繁流動與共享利用狀態,加劇了跨部門、跨行業的數據流動趨勢。因數據具有來源廣、規模大、結構類型豐富、處理行為多樣、擁有權與使用權分離等特點,使數據安全在開放環境下面臨著新的挑戰。

    (1)數據隱私泄露風險高。信息技術的發展極大地促進了社會向著數字化、智能化方向快速發展,數據已經成為承載和描述實體信息的基礎要素,同時也記錄了關系個人和機構的敏感信息。例如,個人使用的網上購物、網上銀行、電子支付、打車平臺、個人政務辦理等數字化服務,會向服務運營商注冊并提供身份證、個人照片、住址、性別、年齡等敏感信息;企業使用商業云計算和大數據平臺執行企業協同辦公、業務流程、財務管理等應用,同樣會導致企業敏感信息被置于第三方運營商中,一些運營商為了提升服務能力,會基于用戶數據進行分析處理。而這些具有挖掘價值的數據,往往成為黑客攻擊的對象。因此,隨著社會數字化進程加快,數據成為描述實體信息的基礎要素,但數據收集和使用的不可控導致數據隱私泄露風險高。

    (2)數據融合安全能力弱。數據作為一種生產要素,能夠通過數據挖掘、聯合分析來產生價值,促進企業生產力的提升。隨著數據挖掘和人工智能技術的發展,需要大量高質量的數據集來生成準確的算法模型,這促進了多個機構間的數據形成特征互補、數據量擴充,以聯合協作的方式執行數據融合計算。但數據涉及用戶和機構的隱私,必須采用安全手段保護數據融合過程的安全。傳統安全防護以邊界防護為主,無法實施數據流通的動態防護。同時,常用的基礎加密技術會破壞數據結構,導致無法執行加密計算,而執行密態處理的同態加密計算、安全多方計算等技術的效率還不能滿足大規模應用的需求。因此,數據作為生產要素需要被匯聚和計算,僅憑當前安全防護技術和加密技術,無法滿足海量密態數據處理需求,呈現出數據融合安全能力弱的問題。

    (3)數據流轉全程監管難。合規性是當前

    數據安全治理的重要內容,在當前政務數據開放共享、互聯網企業聯盟數據共享等背景下,以及國家不斷增強的數據安全法律法規約束下,實施數據內容和數據行為的全程監管是一個具有挑戰性的難題。數據在采集匯聚時,來自不同的終端和用戶,其類型多樣,敏感程度不同,難以實施細粒度的管理。數據流轉使得數據形成一張復雜的數據網絡,其流向復雜、與計算任務深度耦合,難以跟蹤。數據在融合計算時,關聯數據方較多、權重不一、融合計算行為多樣,難以進行授權和可信度量化。因此,數據動態流動頻繁、數據類型豐富、數據利用行為多樣,使數據采集、存儲、傳輸、處理、交換、銷毀等全程監管能力實施難度加大。數據隱私泄露風險高、數據融合安全能力弱、數據流轉全程監管難是當前開放環境下數據安全面臨的主要挑戰。為了應對挑戰,本文以密碼技術為核心,構建新型計算模式,重點解決安全存儲、密態利用、有效監管等關鍵環節的安全防護問題。

    2

    數據安全開發利用技術現狀分析

    數據生命周期主要有采集、傳輸、存儲、處理、交換、銷毀等 6 個階段,在傳統的安全手段中,針對靜態數據主要以加密和認證為主,針對動態數據主要以邊界式防護為主。在采集、傳輸階段的密碼防護手段較為成熟,本文聚焦于動態數據處理,重點分析數據的安全存儲、密態利用和有效監管的現狀。

    2.1 安全存儲

    在安全存儲方面,數據的完整性、可用性、可靠性亟需保障。Bellare 等人(2013 年)、Li等人(2016 年)、Ren 等人(2021 年)提出的輕量級加密存儲方案,Dijk 等人(2012 年)、Fisch 等人(2019 年)、Cecchetti 等人(2019 年)提出的多副本編碼協議,以及 Ateniese 等人(2007年)、Bowers 等人(2009 年)提出的數據完整性驗證技術,推動了分布式安全存儲應用。谷歌 GFS(2003 年)、亞馬遜 Snowball(2006 年)、微軟 OneDrive(2014 年)、華為 GaussDB(2020 年)等云存儲方案的安全性逐漸增強,但都是針對中心化環境而設計,不適用于跨中心或去中心化的分布式存儲。2020 年,主網上線的星際文件系統(InterPlanetary File System,IPFS)采用無中心組網,將加密文件切割成多個碎片,采用基于 zk-SNARK 的副本證明機制,實現安全存儲,周數據增量為 PB 級,且能提供 100 Gbps以上的吞吐量,解決了單點故障等缺陷,但仍存在存儲空間浪費嚴重、數據完整性無保障、數據濫用難控制等問題。

    收斂加密、數據完整性驗證、細粒度訪問控制等技術提升了數據存儲安全性,但存儲環境開放帶來的數據泄露、篡改、刪除等事件對數據安全可靠存儲造成了嚴重威脅,仍然存在技術瓶頸,主要包括加密存儲模式下數據難以去重、加密存儲備份與同步效率低、數據遠程完整性驗證困難。因此,面向海量、異構、多維數據安全可靠存儲,亟需研究輕量級加密、多備份存儲、高效更新、完整性驗證等關鍵技術,為我國數據治理提供安全存儲技術支撐。

    2.2 密態利用

    開放環境下打破數據流通壁壘的關鍵在于解決制約數據利用的隱私保護掣肘。數據安全利用主要涉及可搜索加密、隱私信息檢索等密文檢索技術,以及同態加密、安全多方計算等密態計算技術。其中,在密文檢索方面,Boneh 等人(2004年)、Lai 等人(2018 年)、Wang 等人(2018年)、Bossuat 等人(2021 年) 提出的可搜索加密方案都是針對中心化環境而設計,不適用于跨中心分布式檢索;2011 年,麻省理工學院更新的 CryptDB 密態數據庫系統,在 2.5 萬條數據集下等值、范圍檢索耗時不超過 7.3 秒;NDSS 2021 最新結果表明隱私信息檢索發現方案 在 228 條數據下單次檢索耗時 1.92 秒。在同態計算方面,Brakerski 等人(2012 年)、Fan 等人(2012 年)、Gentry 等人(2013 年)、Cheon 等人(2017 年)提出的方案只適用于中心化的外包計算場景,無法直接應用于多方計算場景;2020 年,IBM 更新的 HeLib 和 Microsft更新的 SEAL 同態密態計算庫的加法門電路計算耗時較少,但是乘法門電路計算耗時動輒數十甚至上百毫秒;2021 年,中國電科三十所依托國家重點研發計劃項目集成的密態數據計算系統能夠實現密文加法、乘法及密文刷新耗時都控制在 10 毫秒內。在安全多方計算方面,Yao(1986 年 )、Damgard 等 人(2012 年 )、Hong 等人(2019 年)、Garimella 等人(2021 年)[22]提出的方案大多難以平衡通信負載、計算開銷和安全強度。對此,國際上,單同態加密標準ISO/IEC 18033-6、安全多方計算標準草案 IEEEP2842、聯邦學習 IEEE 3652.1-2020 相關國際標準被提出。國內,2020 年,中國信息通信研究院成立了隱私計算聯盟;同年,中國人民銀行發布了行業標準 JR/T 0196—2020《多方安全計算金融應用技術規范》,凸顯了密態數據處理技術在國家數據安全發展中的重要作用。

    現有的密態計算技術,能夠實現加密數據下的數據利用,但仍然存在技術瓶頸待突破,主要包括可搜索加密復雜檢索效率低、安全多方計算通信開銷高、同態加密計算耗時大。因此,突破跨中心場景下可搜索加密、同態加密、安全多方計算等實用化關鍵技術,是未來的重要發展方向。

    2.3 數據監管

    數據監管主要涉及數據行為檢測與威脅預警、異常事件取證溯源等技術。在行為檢測與威脅預警方面,2019 年,Amazon 的 Security Hub 將機器學習和模式匹配技術應用于敏感數據識別,實現了自動化持續安全性檢查,并規范化調查結果格式;2020 年,IBM QRadar 在推出的最新版本中引入異常搜索參數,檢測超過 7 萬種異常與危險,并利用人工智能技術的自動分類將調查速度提高了 60 倍,實現了秒級實時監控與危險預警。在異常事件取證溯源方面,2019 年,Exabeam 提出 Cloud Archive 組件以提供可搜索的日志存儲,該組件可將數據保留長達 10 年,通過構建日志事件時間線實現威脅事件的取證溯源;2020 年,Splunk 整合數據利用行為日志,用于加速關聯屬性異常定位,結合自動化的噪音事件隔離和端對端的信息共享,實現在秒級以內對 65 種異常和 25 種威脅行為的范圍確定與原因追溯;國內山東大學、數字廣東網絡建設有限公司等團隊也在此領域進行了深入的探索,對于多源異構數據采集、數據標準體系建設、數據資產治理與監管 3 個層面,建立了涵蓋數據快速定位、數據流轉監管的技術體系。總體而言,目前數據流轉監管技術大多部署在行業數據中心內部,缺乏對開放平臺數據利用行為的準確監測,數據利用的合理規則策略尚未形成。因此,亟需研究開放環境下數據利用行為監管技術,制定全日志自動審計規則,構建層級化監管平臺。

    數據監管經歷了人工為主的初級監管、自動化監管、大數據監管,以及正在發展的智能化監管,但仍然存在技術瓶頸,主要包括現有監管方案不適合開放平臺,數據行為合規策略尚未形成,層級化第三方監管效率低。因此,亟需構建事前、事中、事后全鏈條運用的大數據化智能監管。

    綜上,目前大數據安全利用技術僅具備海量數據簡單密態處理能力,不能滿足開放環境下跨中心海量數據流通的復雜處理安全需求。我國在數據安全利用理論、算法設計、系統開發方面尚需突破,產業化尚處于探索階段。亟需創新開放環境下自主、安全、可信的數據安全利用算法理論和關鍵技術,推動我國數據要素可信流通,助力數字經濟健康發展。

    3

    數據安全開發利用技術架構

    密碼技術是信息安全、數據安全的核心技術,是成本低、防護最有效的安全技術。本節以密態計算、區塊鏈技術為核心設計數據安全開發利用平臺架構,實現跨中心的數據安全流通,建立數據可控共享、合規監管的數據安全開發利用平臺系統。

    3.1 數據安全開發利用平臺架構設計

    為了促進數據要素在各個機構間安全流通,本文基于密態計算、區塊鏈等技術,設計了數據安全開發利用平臺架構,以實現數據安全融合共享。主要涉及數據提供方、數據使用方、平臺運營方、可信監管方等角色,其職責如下文所述。

    (1)數據提供方。數據的歸屬方,或者受委托存儲和管理數據的服務運營方,存儲了大量的數據,并負責執行本地明文計算、明密文計算等任務。(2)數據使用方。數據開發利用請求的發起方,根據具體的業務需求,向數據開發利用平臺發起數據請求(包括所需的數據集、業務執行代碼等),并獲取和解密最終的數據計算結果。(3)平臺運營方。數據開發利用任務的具體執行者和協調者,解析數據使用方業務請求,根據所涉及的數據集位置,執行安全計算,輸出計算結果。(4)可信監管方。權威合規性監管機構或運營平臺自身的監管方,負責整個系統的密鑰管理和身份認證授權,執行事前授權、事中感知、事后追溯的全程監管。

    如圖 1 所示,本文基于分布式加密存儲、本地化明文計算、平臺化密態處理計算模式,設計數據安全開放利用平臺架構,構建分布式存儲引擎、密文高效檢索引擎、密文協同計算引擎,實施智能化監管手段,形成以“原始數據不共享、數據流轉必加密、數據可用不可見”為原則的數據可控共享機制。

    圖 1 數據安全開放利用平臺架構

    (1)分布式存儲引擎。以區塊鏈為基礎設施,構建分布式存儲模式。采用收斂加密、多備份存儲、增量同步等技術,實現加密數據下的低冗余、高可靠存儲。融合遠程完整性驗證技術,實現委托存儲數據的低通信量、高準確率的完整性驗證。(2)密文高效檢索引擎。面向分布式存儲模式,構造分布式數據索引結構。以對稱可搜索加密技術為基礎,設計基于對稱密碼的鏈式密文檢索方法,通過檢索令牌的密態轉換,實現不同數據中心的高效索引檢索。同時,在密文檢索結果中嵌入認證結構,實現對檢索結果完備性和正確性的驗證。(3)密文協同計算引擎。以同態加密、安全多方計算協議為核心,通過密文轉換實現二者密態計算方法的融合,充分利用高維矩陣同態高效計算、安全多方計算的非線性計算等優勢,實現大規模密態數據的復雜計算能力。采用零知識證明、同態哈希等技術,實現對密文計算結果的正確性驗證。(4)監管系統。基于身份分級授權,設計分布式數字身份管理與訪問控制方案,制定數據開發利用的約束規則,構建多維度事務動作的日志審計管理。基于自然語言處理、深度學習等技術,實現智能化實時異常檢測與風險預警。通過行為日志的上鏈和狀態遷移模型,實現數據取證和追蹤溯源。

    本架構的具體運行流程如下:

    (1)數據注冊與發布。數據提供方向平臺注冊身份,并對所持有的數據也進行注冊,上傳其元數據,并進行發布。(2)數據安全存儲。數據提供方可以使用平臺提供安全存儲服務,將數據加密,并委托給平臺進行分布式存儲。(3)數據利用請求。數據使用方查看平臺中發布的數據描述,根據業務需要,選擇相應的數據集,并編寫相應業務代碼,發送給平臺。(4)數據利用解析與執行。平臺根據請求中所包含的數據集和計算邏輯,將計算任務分割為數據提供方的本地任務、多個數據利用方協同任務、平臺全局任務,形成一個完整的任務流,并啟動任務執行。數據提供方在本地執行明文計算或明密文計算,并加密上傳中間結果。平臺執行全局任務調度和全局密態計算,聚合成最終的加密計算結果,并返回給數據使用方。(5)結果獲取與解密。數據使用方獲得平臺返回的加密結果,并使用自己的私鑰解密,得到明文計算結果。

    3.2 數據安全流通格式結構設計探索

    20 世紀 70 年代,美國開發了傳輸控制協議 /網 際 協 議(Transmission Control Protocol/Internet Protocol,TCP/IP),該協議用于不同網絡中,以實現信息的傳輸,使得電子化信息數據廣泛在網絡上傳播使用,極大地加速了全球網絡的互聯互通。其中 IP 報文與 IP 協議是關鍵。類比當前的數字經濟時代,數據作為生產要素,需要在不同機構中以數據本身或者中間計算結果進行流通,同樣可以組成一個數據融合網絡。因此,本文提出數據安全流通格式結構的設計思路。

    安全是數據要素流通的基礎,必須在數據中將安全屬性作為基因加入。如圖 2 所示,本文提出的數據安全流通格式結構包含了數據 ID號、認證碼、敏感等級、數據關聯者、標簽、數據簽名、密碼算法 ID、源數據節點地址、目的數據節點地址、加密的有效數據。

    數據 ID 號表示該數據安全流通格式的唯一身份號,用于數據格式的審計定位。認證碼用于數據完整性驗證。敏感等級表示數據的敏感程度,可以對數據進行隱私等級的劃分。數據關聯者表示該數據歸屬的數據方以及權重,用于對數據歸屬權的界定。標簽表示特點用途的標簽信息,用于業務需求的數據分級分類標識。數據簽名為數據關聯者對該數據的簽名,用于驗證數據歸屬權。密碼算法 ID 用于表示該有效數據的加密使用的加密算法。源數據節點地址表示數據提供方的地址,是數據的來源節點。目的數據節點地址表示數據將要流向的目的數據節點,以備進行數據處理。加密數據表示加密的有效數據,將有效載荷數據進行加密后形成的密文。

    圖 2 數據安全流通格式結構

    如圖 3 所示,數據融合網絡實現不同地域、不同數據中心、不同機構間的數據流通,仍然以“原始數據不共享、數據流轉必加密、數據可用不可見”的原則進行交換和共享。數據處理節點執行對數據的產生、存儲、計算等操作,形成中間計算結果或者最終輸出結果。當數據使用者在某個數據節點(稱為主任務節點)發起請求時,該數據節點將會分析該請求所需要的數據資源,當本身數據資源滿足需求時,將直接執行計算任務;當本身數據資源不滿足需求時,將通過本身的數據目錄向相鄰數據節點發起請求,以此建立該請求所對應的數據相關網絡(相關的數據節點稱為從任務節點)。主任務節點根據從任務節點解析數據使用請求的計算任務,并將相關的子任務和全局流程發給從任務節點,以執行相應的計算任務。結合本文提出的數據安全開放利用平臺架構,將在主任務節點生成最終的計算結果,并返回給數據使用者。

    圖 3 數據融合網絡

    3.3 數據安全開發利用平臺系統組成

    本文所提出的數據安全開發利用平臺系統組成如圖 4 所示,主要由數據提供接入端系統、數據使用客戶端系統、數據開發利用協同系統、數據利用監管系統組成。數據提供方通過數據提供接入端系統接入到數據安全開發利用平臺。數據使用方通過數據使用客戶端系統訪問數據安全開發利用平臺。平臺運營方負責運營和管理數據安全開發利用平臺,執行數據開發利用協同系統和數據利用監管系統。

    圖 4 數據安全開發利用平臺系統組成

    (1)數據提供接入端系統。部署于各個數據提供方,其主要由客戶端監管組件、數據資源注冊與發布、本地存儲資源、多功能密碼算法融合加密、本地數據處理引擎組成。承擔數據提供方的數據注冊、本地存儲、數據分級加密、本地明文計算、本地監管等功能。該系統主要以硬件設備方式提供。(2)數據使用客戶端系統。部署于數據使用方,是數據使用方獲取數據開發利用的入口,主要負責登錄授權、請求發起、結果獲取等功能。該系統可以是硬件、軟件的形式。(3)數據開發利用協同系統。是數據開發利用平臺的主系統,集成了海量數據安全存儲系統、大規模密態數據協同計算系統、密態數據高效檢索系統等密態處理引擎,并部署了數據資源目錄、數據主題模板庫、授權管理、數據處理任務智能分割與柔性調度、密態處理結果的正確性與完整性驗證模塊。主要承擔數據安全存儲、密文檢索、密態計算、訪問控制、監管接入等功能,并負責將數據使用者發起的請求進行解析和分割,協調各個數據提供方的計算任務。可以看出,整個數據開發利用協調系統執行的計算任務為全程密態計算。(4)數據利用監管系統。負責對數據開發利用協同系統、數據使用客戶端系統、數據提供接入端系統執行全程透明監管,并對外提供監管接入應用程序編程接口(Application ProgrammingInterface,API),使得政府、公安等機構能夠接入系統實施全程監管。該系統基于智能化技術實現事前授權、事中感知、事后追溯。

    4

    數據安全開發利用的應用場景

    當前數字化進程不斷加快,社會生活邁進了大數據化、智能化的時代,數據為產業賦能成效顯著,數據要素安全流通已經成為數字經濟健康發展的重要保障。本文提出了開放環境下大數據安全開發利用平臺架構,為數據要素安全流通提供參考,能夠實現“原始數據不共享、數據流轉必加密、數據可用不可見”可控共享機制。本文給出該架構在跨機構數據交易、金融風控數據聯合建模的應用場景。

    (1)跨機構數據交易。為了激發數據要素活力,北京、上海等地區已經落地數據交易機構,將數據資源市場化,構建數據資源供應方和需求方之間的橋梁。本文所提出的解決方案,能夠實現數據注冊與發布,形成一個數據資源市場。如圖 5 所示,數據使用方可以訪問數據安全開發利用平臺,查詢線上發布的數據,按需挑選數據,付費使用。同時,算法提供方也可以將所研發的數據利用算法以加密形式部署到數據安全開發利用平臺,以供數據使用方選擇使用。本文的方案提供了數據監管接口,可以接入權威機構,保障數據市場的有序運行。

    圖 5 基于數據安全開發利用平臺的跨機構數據交易應用場景

    (2)金融風控聯合建模。為了維護金融管理秩序,銀行、證券等金融機構需要防范欺詐,實施風險控制。根據交易行為、用戶特征、歷史記錄、環境條件等信息識別欺詐行為,是事前反欺詐的重要手段。但通常單一銀行機構所擁有的數據量小,模型構建的樣本或特征不足,無法建立推理準確度高的機器學習算法。如圖 6所示,基于本文提出的數據安全開發利用平臺架構,可以聯合多家機構的數據進行聯合建模,訓練出準確度高、泛化能力強的模型算法。當一家銀行獲得新型欺詐行為相關的數據時,可以及時更新模型參數,使其他銀行也能夠快速具備預測和識別新型欺詐行為的能力,從而提高銀行抗風險的能力。

    圖 6 基于數據安全開發利用平臺的金融風控聯合建模應用場景

    5

    結 語

    本文分析了開放環境下的數據安全挑戰和數據安全開發利用的技術現狀,針對性地提出了開放環境下數據安全開發利用平臺的技術架構和系統組成。但面對當前日益嚴重的開放環境下數據安全形勢,仍需要持續關注數據安全的防護,全面支撐數字經濟的高質量發展,對此,提出以下幾點應對建議。

    (1)加大數據合規監管力度。近年來,國家高度重視安全建設,統籌發展和安全,推進行業數據安全保障能力提升,構建起堅實有力的安全法律屏障,形成了《中華人民共和國網絡安全法》《中華人民共和國密碼法》《中華人民共和國數據安全法》《中華人民共和國個人信息保護法》“四法共治”的新局面,但國內數據監管仍存在技術標準不統一、行業資源配置割裂、監管力度不足等問題,建議結合頂層設計、法律法規,以及數據安全新監管的要求,出臺相關數據監管技術標準規范,同時體現對過程和結果的合規要求,明確數據處理者既應當從過程方面積極履行數據安全保護義務,也要對數據安全防護的最終結果負責。

    (2)加強數據安全技術創新。密碼是保證數據安全的重要手段,加密數據存儲與密態數據分析利用技術的結合能夠更好地護航“新基建”場景泛在化發展,對我國數字經濟的發展具有重大意義。雖然我國在數據安全存儲發展方面已取得一定成績,但仍然存在較大差距,加密存儲使用不夠普及,相關密態計算技術仍有瓶頸,未能得到廣泛應用。建議進一步推進加密數據存儲與密態數據分析利用技術的研究,深化可搜索加密、同態加密、安全多方計算等密態計算領域基礎研究,形成海量數據加密存儲與密態數據分析利用方面的實用化方案,為產業化提供基礎。

    (3)打造網絡安全與數據安全協調發展。傳統的城防式數據安全,主要是保護被傳統物理網絡多層包圍的數據,這種防護體系僅適用于保護靜態數據。如今,數據已成為新的生產要素,數據被充分共享流轉以產生價值,傳統的城防式數據安全已經難以滿足需求。因此,建議網絡安全與數據安全并重建設,針對數據本身進行主動式防護,面向失效的安全機制,將數據安全技術和網絡安全問題進行融合,創造性地提供新框架、新方法,通過聯動協同的縱深安全機制,構建有效防線。

    (4)加快數據安全人才培養。人才是數據安全發展和數字經濟健康發展的血液。數據安全技術研發需要專業性技術人才,企業組織機構的數據安全問題防護與合規性建設需 要 數 據 保 護 官(Data Protection Officer,DPO)。但由于數據安全技術研發涉及密碼學、計算機科學、數據科學、人工智能等門類知識,是一門綜合性很強的專業領域,同時,數據安全管理涉及數據質量、數據合規、數據資產、應急處置、安全檢測評估等領域,管理復雜度較高。這導致數據安全技術研發、數據安全管理等方面的人才稀缺。因此,應該聯合國內院校,結合國家數字經濟健康發展需要,加強數據安全人才培養,建立數據安全人才崗位認證體系。

    引用本文:張帥領 , 湯殿華 , 胡華鵬 . 開放環境下大數據安全開發利用的挑戰和思考 [J]. 信息安全與通信保密 ,2022(5):59-72

    大數據數據安全
    本作品采用《CC 協議》,轉載必須注明作者和本文鏈接
    “卓信數據計劃”持續招募成員單位,預計2022年3月前完成第六批(2022年第二批)100家相關企業招募審核工作。
    當前,以數字經濟為代表的新經濟成為經濟增長新引擎,數據作為核心生產要素成為了基礎戰略資源,數據安全的基礎保障作用也日益凸顯。伴隨而來的數據安全風險與日俱增,數據泄露、數據濫用等安全事件頻發,為個人隱私、企業商業秘密、國家重要數據等帶來了嚴重的安全隱患。近年來,國家對數據安全與個人信息保護進行了前瞻性戰略部署,開展了系統性的頂層設計。《中華人民共和國數據安全法》于2021年9月1日正式施行,《中華人
    前言:工信部召開“十四五”信息通信行業發展規劃新聞發布會。工信部網絡安全管理局副局長杜廣達在會上回答有關“數據安全”和“網絡安全”等問題。
    高額獎金等你來拿~
    隨著《中華人民共和國密碼法》和《國家政務信息化項目建設管理辦法》(國辦發〔2019〕57 號)的發布,以密碼為核心的網絡安全的重要性越發凸顯。然而,在國內智慧城市的大規模建設中,“重業務、輕安全”的現象普遍存在。密碼技術作為智慧城市網絡安全的基礎與核心技術,從智慧城市密碼的應用架構、密碼核心技術、防護能力、解決的應用領域、密碼應用實踐等方面分別進行了闡述,可以解決智慧城市建設中出現的安全性問題,
    醫療物聯網升溫態勢明顯,做好安全保障前置了嗎?
    10月16日至17日,“天府杯”國際網絡安全大賽暨2021天府國際網絡安全高峰論壇將在成都天府國際會議中心舉行。本屆“天府杯”國際網絡安全大賽將總獎金額提升至150萬美元。“網絡安全紅云展”和“反詐宣傳展”兩特色科普宣傳展將在天府杯活動中首度亮相。值得一提的是,這兩項特色科普展覽原計劃于今年8月舉行的2021北京網絡安全大會上首次展出。但受突發疫情影響,北京網絡安全大會改為線上舉行
    本報告通過六張實戰推演圖,結合安全能力者、第三方機構和安全運營者的觀點,展示了攻擊方從攻擊面分析、邊界突破、橫向滲透到靶標攻陷的攻擊過程,防守方從基礎保護、強化保護到協同保護的縱深防御體系,描繪了大型網絡安全攻防實戰演習的全景對象和步驟推演。
    11月16日,在工業和信息化部舉辦的《“十四五”信息通信行業發展規劃》新聞發布會上,工信部信息通信發展司司長謝存介紹了《規劃》起草的背景、過程、主要考慮和相關內容。
    VSole
    網絡安全專家
      亚洲 欧美 自拍 唯美 另类