術語和定義
術語和定義
GB/T 25069—2010中界定的以及下列術語和定義適用于本文件。
3.1 個人信息 personal information
以電子或者其他方式記錄的能夠單獨或者與其他信息結合識別特定自然人身份或者反映特定自然人活動情況的各種信息。
3.2 個人信息主體 personal data subject
個人信息所標識的自然人。
3.3 去標識化 de-identification
通過對個人信息的技術處理,使其在不借助額外信息的情況下,無法識別個人信息主體的過程。
[GB/T 35273-2017,定義3.14]
3.4 微數據 microdata
一個結構化數據集,其中每條(行)記錄對應一個個人信息主體,記錄中的每個字段(列)對應一個屬性。
3.5 聚合數據 aggregate data
表征一組個人信息主體的數據,比如各種統計值的集合。
3.6 標識符 identifier
微數據中的一個或多個屬性,可以實現對個人信息主體的唯一識別。
3.7 直接標識符 direct identifier
微數據中的屬性,在特定環境下可以單獨識別個人信息主體。例如:姓名、身份證號、護照號、駕照號、地址、電子郵件地址、電話號碼、傳真號碼、銀行卡號碼、車牌號碼、車輛識別號碼、社會保險號碼、健康卡號碼、病歷號碼、設備標識符、生物識別碼、互聯網協議(IP)地址號和網絡通用資源定位符(URL)等。
3.8 準標識符 quasi-identifier
微數據中的屬性,結合其它屬性可唯一識別個人信息主體。比如:性別、出生日期或年齡、事件日期(例如入院、手術、出院、訪問)、地點(例如郵政編碼、建筑名稱、地區)、族裔血統、出生國、語言、原住民身份、可見的少數民族地位、職業、婚姻狀況、受教育水平、上學年限、犯罪歷史、總收入和宗教信仰等。
3.9 重標識 re-identification
把去標識化的數據集重新關聯到原始個人信息主體或一組個人信息主體的過程。
3.10 敏感屬性 sensitive attribute
數據集中需要保護的屬性,該屬性值的泄露、修改、破壞或丟失會對個人產生損害。
3.11 有用性 usefulness
數據對于應用有著具體含義、具有使用意義的特性。去標識化數據應用廣泛,每種應用將要求去標識化數據具有某些特性以達到應用目的,因此在去標識化后,需要保證對這些特性的保留。
3.12 完全公開共享 completely public sharing
數據一旦發布,很難召回,一般通過互聯網直接公開發布。
3.13 受控公開共享 controlled public sharing
通過數據使用協議對數據的使用進行約束,數據使用協議規定內容應包含但不限于:
a) 禁止信息接收方發起對數據集中個體的重標識攻擊;
b) 禁止信息接收方關聯到外部數據集或信息;
c) 禁止信息接收方未經許可共享數據集。
比如,針對合格的研究者,可基于數據使用協議共享數據。
3.14 領地公開共享 enclave public sharing
在物理或者虛擬的領地范圍內共享,數據不能流出到領地范圍外。
3.15 去標識化技術 de-identification technique
降低數據集中信息和個人信息主體關聯程度的技術。
注1:降低信息的區分度,使得信息不能對應到特定個人,更低的區分度是不能判定不同的信息是否對應到同一個個人,實踐中往往要求一條信息可能對應到的人數超過一定閾值。
3.16 去標識化模型 de-identification model
應用去標識化技術并能計算重標識風險的方法。
GB/T37964-2019 信息安全技術 個人信息去標識化指南
推薦文章: