數據脫敏,是指在不影響數據分析結果的準確性前提下,對原始數據中的敏感字段進行處理,從而降低數據敏感度和減少個人隱私風險的技術措施。常見的數據脫敏方法主要包括:
數據替換
用設置的固定虛構值替換真值。例如將手機號碼統一替換為 13800013800
反推斷
查找可能由某些字段推斷出另一敏感字段的映射,并對這些字段進行脫敏,如從出生日期可推斷出身份證號、性別、地區的場景。
偏移和取整
通過隨機移位改變數字數據,例如日期 2018-01-02 8 : 12 : 25 變為 2018-01-02 8 : 00 : 00,偏移取整在保持了數據的安全性的同時保證了范圍的大致真實性,此項功能在大數據利用環境中具有重大價值。
掩碼屏蔽
掩碼屏蔽是針對賬戶類數據的部分信息進行脫敏時的有力工具,比如銀行卡號或是身份證號的脫敏。將身份證號的出生日期進行掩碼屏蔽脫敏。使用left()函數截取身份證號的左邊 6 位 + 字符串 ****+right()函數截取身份證號右邊 4 位替換源身份證字符串。
靈活編碼
在需要特殊脫敏規則時,可執行靈活編碼以滿足各種可能的脫敏規則。比如用固定字母和固定位數的數字替代合同編號真值。將合同編號進行自定義編碼脫敏。自定義編碼規則:4 位固定碼 + 當前年份 + 源目標字符串 4 位號碼 +9 位數值組成。
無效化
通過對數據值得截斷、加密、隱藏等方式使敏感數據脫敏,使其不再具有利用價值,例如將地址以 ** 代替真值。數據無效化與數據替換所達成的效果基本類似。
隨機化
用隨機數據代替真值,保持替換值的隨機性以模擬樣本的真實性。例如用隨機生成的姓和名代替真值。
加密
指對待脫敏數據進行加密處理,使 外部用戶只看到無意義的加密后數據,同時在特定場 “云計算與大數據”專題 19 2015年第13期 景下,可以提供解密能力,使具有密鑰的相關方可以 獲得原數據。加密的方法存在一定的安全風險(密鑰 泄露或加密強度不夠);加密本身需要一定的計算 能力,對于大數據集來源會產生很大資源開銷;一般 加密后數據與原始數據格式差異較大,“真實性”較 差。一般情況下,加密的數據脫敏方式應用不多。
遮擋
指對敏感數據的部分內容用掩飾符號(如“X、*”)進行統一替換,從而使 得敏感數據保持部分內容公開。這種方法可以在很大 程度上脫敏的同時,保持原有數據感觀,也是一種廣 泛使用的方法。
回答所涉及的環境:聯想天逸510S、Windows 10。
數據脫敏,是指在不影響數據分析結果的準確性前提下,對原始數據中的敏感字段進行處理,從而降低數據敏感度和減少個人隱私風險的技術措施。常見的數據脫敏方法主要包括:
數據替換
用設置的固定虛構值替換真值。例如將手機號碼統一替換為 13800013800
反推斷
查找可能由某些字段推斷出另一敏感字段的映射,并對這些字段進行脫敏,如從出生日期可推斷出身份證號、性別、地區的場景。
偏移和取整
通過隨機移位改變數字數據,例如日期 2018-01-02 8 : 12 : 25 變為 2018-01-02 8 : 00 : 00,偏移取整在保持了數據的安全性的同時保證了范圍的大致真實性,此項功能在大數據利用環境中具有重大價值。
掩碼屏蔽
掩碼屏蔽是針對賬戶類數據的部分信息進行脫敏時的有力工具,比如銀行卡號或是身份證號的脫敏。將身份證號的出生日期進行掩碼屏蔽脫敏。使用left()函數截取身份證號的左邊 6 位 + 字符串 ****+right()函數截取身份證號右邊 4 位替換源身份證字符串。
靈活編碼
在需要特殊脫敏規則時,可執行靈活編碼以滿足各種可能的脫敏規則。比如用固定字母和固定位數的數字替代合同編號真值。將合同編號進行自定義編碼脫敏。自定義編碼規則:4 位固定碼 + 當前年份 + 源目標字符串 4 位號碼 +9 位數值組成。
無效化
通過對數據值得截斷、加密、隱藏等方式使敏感數據脫敏,使其不再具有利用價值,例如將地址以 ** 代替真值。數據無效化與數據替換所達成的效果基本類似。
隨機化
用隨機數據代替真值,保持替換值的隨機性以模擬樣本的真實性。例如用隨機生成的姓和名代替真值。
加密
指對待脫敏數據進行加密處理,使 外部用戶只看到無意義的加密后數據,同時在特定場 “云計算與大數據”專題 19 2015年第13期 景下,可以提供解密能力,使具有密鑰的相關方可以 獲得原數據。加密的方法存在一定的安全風險(密鑰 泄露或加密強度不夠);加密本身需要一定的計算 能力,對于大數據集來源會產生很大資源開銷;一般 加密后數據與原始數據格式差異較大,“真實性”較 差。一般情況下,加密的數據脫敏方式應用不多。
遮擋
指對敏感數據的部分內容用掩飾符號(如“X、*”)進行統一替換,從而使 得敏感數據保持部分內容公開。這種方法可以在很大 程度上脫敏的同時,保持原有數據感觀,也是一種廣 泛使用的方法。
回答所涉及的環境:聯想天逸510S、Windows 10。