敏感數據面臨的挑戰如下:
如何將敏感數據訪問的審批在執行環節有效落地:對于敏感數據的訪問、對于批量數據的下載要進行審批制度,這是數據治理的關鍵;但工單的審批若是在執行環節無法有效控制,訪問審批制度僅僅是空中樓閣。
如何對突破權控管理的黑客技術進行防御:基于數據庫的權限控制技術,在基于漏洞的攻擊的基礎上將很容易被突破。
如何在保持高效的同時實現存儲層的加密:基于文件層和硬盤層的加密將無法與數據庫的權控體系結合,對運維人員無效,如何實現存儲加密、權限控制和快速檢索的整體解決,是這一問題的關鍵,只有這樣的存儲加密才能保證安全的同時數據可用。
如何實現保持業務邏輯后的數據脫敏:對于測試環境、開發環境和 BI 分析環境中的數據需要對敏感數據模糊化,但模糊化的數據保持與生產數據的高度仿真,是實現安全可用的基礎。
如何實現數據提取分發后的管控:數據的共享是數據的基本使用屬性,但數據的復制是沒有痕跡的;數據分發后如何保證數據不會被流轉到失控的環境,或者被復制后可溯源,這是數據提取分發管理的關鍵。
可以通過以下方案將敏感數據進行脫敏:
無效化:無效化方案在處理待脫敏的數據時,通過對字段數據值進行 截斷、加密、隱藏 等方式讓敏感數據脫敏,使其不再具有利用價值。一般采用特殊字符代替真值,這種隱藏敏感數據的方法簡單,但缺點是用戶無法得知原數據的格式,如果想要獲取完整信息,要讓用戶授權查詢。
隨機值:隨機值替換,字母變為隨機字母,數字變為隨機數字,文字隨機替換文字的方式來改變敏感數據。這種方案的優點在于可以在一定程度上保留原有數據的格式,往往這種方法用戶不易察覺的。
數據替換:數據替換與前邊的無效化方式比較相似,不同的是這里不以特殊字符進行遮擋,而是用一個設定的虛擬值替換真值。
對稱加密:對稱加密是一種特殊的可逆脫敏方法,通過加密密鑰和算法對敏感數據進行加密,密文格式與原始數據在邏輯規則上一致,通過密鑰解密可以恢復原始數據,要注意的就是密鑰的安全性。
平均值:平均值方案經常用在統計場景,針對數值型數據,我們先計算它們的均值,然后使脫敏后的值在均值附近隨機分布,從而保持數據的總和不變。
偏移和取整:這種方式通過隨機移位改變數字數據,偏移取整在保持了數據的安全性的同時保證了范圍的大致真實性,比之前幾種方案更接近真實數據,在大數據分析場景中意義比較大。
回答所涉及的環境:聯想天逸510S、Windows 10。
敏感數據面臨的挑戰如下:
如何將敏感數據訪問的審批在執行環節有效落地:對于敏感數據的訪問、對于批量數據的下載要進行審批制度,這是數據治理的關鍵;但工單的審批若是在執行環節無法有效控制,訪問審批制度僅僅是空中樓閣。
如何對突破權控管理的黑客技術進行防御:基于數據庫的權限控制技術,在基于漏洞的攻擊的基礎上將很容易被突破。
如何在保持高效的同時實現存儲層的加密:基于文件層和硬盤層的加密將無法與數據庫的權控體系結合,對運維人員無效,如何實現存儲加密、權限控制和快速檢索的整體解決,是這一問題的關鍵,只有這樣的存儲加密才能保證安全的同時數據可用。
如何實現保持業務邏輯后的數據脫敏:對于測試環境、開發環境和 BI 分析環境中的數據需要對敏感數據模糊化,但模糊化的數據保持與生產數據的高度仿真,是實現安全可用的基礎。
如何實現數據提取分發后的管控:數據的共享是數據的基本使用屬性,但數據的復制是沒有痕跡的;數據分發后如何保證數據不會被流轉到失控的環境,或者被復制后可溯源,這是數據提取分發管理的關鍵。
可以通過以下方案將敏感數據進行脫敏:
無效化:無效化方案在處理待脫敏的數據時,通過對字段數據值進行 截斷、加密、隱藏 等方式讓敏感數據脫敏,使其不再具有利用價值。一般采用特殊字符代替真值,這種隱藏敏感數據的方法簡單,但缺點是用戶無法得知原數據的格式,如果想要獲取完整信息,要讓用戶授權查詢。
隨機值:隨機值替換,字母變為隨機字母,數字變為隨機數字,文字隨機替換文字的方式來改變敏感數據。這種方案的優點在于可以在一定程度上保留原有數據的格式,往往這種方法用戶不易察覺的。
數據替換:數據替換與前邊的無效化方式比較相似,不同的是這里不以特殊字符進行遮擋,而是用一個設定的虛擬值替換真值。
對稱加密:對稱加密是一種特殊的可逆脫敏方法,通過加密密鑰和算法對敏感數據進行加密,密文格式與原始數據在邏輯規則上一致,通過密鑰解密可以恢復原始數據,要注意的就是密鑰的安全性。
平均值:平均值方案經常用在統計場景,針對數值型數據,我們先計算它們的均值,然后使脫敏后的值在均值附近隨機分布,從而保持數據的總和不變。
偏移和取整:這種方式通過隨機移位改變數字數據,偏移取整在保持了數據的安全性的同時保證了范圍的大致真實性,比之前幾種方案更接近真實數據,在大數據分析場景中意義比較大。
回答所涉及的環境:聯想天逸510S、Windows 10。