數據分類分級模板解析
在《數據安全法》《個人信息保護法》《個人信息安全規范》為代表的眾多法律規范指引下,數據分類分級成為各行各業數據管理和數據安全的熱門話題。過去數據梳理和分類分級多由服務團隊純人工來實現,隨著科學技術的發展,近年來自動化產品步入舞臺,承擔起智能的數據分類分級的工作,降低了人員投入成本,也提高了對數據精細化管理的效果。在自動化數據分類分級中,關鍵在于內置的數據分類分級模板和模板內關聯的眾多檢測規則,本文將進一步解析數據分類分級模板的種類和所包含的規則內容。
數據分類分級模板種類
數據分類分級模板基本上依據法律規范做行業區分,個人信息屬于全行業,當前最權威的為GB/T 35273—2020《信息安全技術 個人信息安全規范》,其他均以各行業標準為主要參考依據,如電信、移動、金融、工業已有發布的標準,政務、教育、醫療、能源、交通,以及眾多細分行業也在數據分類分級的標準制作推進中。模板應該是貼合實際情況,涵蓋大多數數據的屬性,從根本上解決數據管理員對數據分類分級的訴求。

數據分類分級規則解析
模板中會存在眾多規則,旨在讓數據識別、數據分類、數據分級、數據打標更加全面、準確。規則要細化到字段名、字段內容、字段備注等內容,規則的編寫以關鍵字、正則表達式為落腳點,配合機器學習和神經網絡等先進的算法,產生出定義準確、識別率高且準確的規則內容,此規則一旦應用到自動化產品中,將為數據分類分級工作帶來本質上的變化,降本增效自然達成。
下面以個人信息為例做自動化分類分級效果展示:

★ 分類
以一級二級三級來進行細分到最小子類,用來做精細的標簽化管理。
★ 分級
數據敏感級別,如個人信息和個人隱私,就屬于兩個高低不同的級別。
★ 敏感數據
利用掃描到的結果進行展示,證明識別的準確度,主要展示的內容一定是脫敏后且能體現出數據特征的數據。
★ 列
數據所在位置列
★ 字段中文名
體現出字段的中文名稱
★ 字段類型
數據字段所屬類型
★ 表名
數據所在的位置表名稱
★ 庫名
數據所在的位置庫名稱
通過掃描結果,數據管理員可以對數據內容一目了然,分類和分級可做數據資產統計的依據,位置信息做為資產地圖的標記,組合的數據又可發現數據所在位置的敏感度風險,這一切的結果都是取決于前面提到的數據分類分級模板規則的定義,所以說,規則寫的越全面細致,掃描數據識別越全面準確,至于機器學習的技術能力就是來動態調整規則與數據的匹配度,讓數據識別更精準。
綠盟科技自主研發的敏感數據發現與風險評估系統IDR,已經幫助客戶梳理數據超過百億條,剖析各類數據分類分級標準,制作各行業數據分類分級模板規則總計約10000余條,可滿足不同客戶的使用需求,還可以通過自定義規則增加實際業務數據的類型,增加更多業務粘性,讓數據管理和數據安全更快一步。
IDR產品對結構化數據、半結構化數據、非結構化數據都可識別,掃描方式更是多種多樣,全表掃描讓未知數據瞬間浮出水面,指定表掃描精準有效,增量掃描及時發現數據變化,斷點續掃拒絕資源浪費,定期周期掃描讓數據掃描更輕松,內置機器學習和神經網絡算法,讓數據識別方式更靈活、數據識別效率更優質、數據識別準確率更高效。