數據治理的三種共享范式
數據共享范式的演變,從過度授權的“默認知道”(Default-to-Know),到默認不共享的“需要知道”( Need-to-know),再到默認共享的“需要共享”( Need-to-share)。這些范式,本質上是在數據價值和數據風險之間進行取舍和平衡。
眾所周知,安全法規和最佳實踐似乎經常要求組織將數據鎖定,從而限制“需要知道”的員工的訪問。然而,數據只有與需要它的人共享時,才有價值。但是,數據的更廣泛共享,既需要秉持“需要共享”的原則,又需要采用創新的數據安全方法,如數據安全治理框架和數據安全平臺。
數據共享范式將影響許多數據驅動型組織。根據Gartner的觀點,到2025年,30%的Gartner客戶將使用“需要共享”方法,而非傳統的“需要知道”方法,來保護他們的數據。
組織應該審視:其數據安全策略和數據安全治理框架,是否還停留在石器時代。
目 錄
1.杰出數據共享的好處
2.傳統數據共享的問題
3.從“默認知道”到“需要知道”
4.從“需要知道”到“需要共享”
5.DataSecOps方法
01
杰出數據共享的好處
杰出數據共享意味著,大量用戶可以快速、輕松地訪問數據,以便他們可以分析數據并使用數據,來改善各種職能(包括客戶服務、留存、支持、運營、營銷、銷售等)的業務成果。
杰出數據共享蘊含了數據民主化的理念,使組織內的盡可能多的人能夠訪問數據,并將其轉化為有意義的業務價值。
杰出數據共享有以下主要好處:
- 當組織中的許多數據消費者使用數據時,他們能夠快速將數據轉化為價值,組織將獲得較高的數據投資回報率。
- 當組織擁有杰出數據共享時,數據產品/項目的上市時間和實現價值的時間就會縮短。這可能會對組織的業務結果產生重大影響。
- 當組織的數據共享運行良好時,組織可以減少數據的瓶頸和排隊時間。這使組織的用戶(如數據科學家、業務分析師、工程師)更加快樂,并使數據工程和數據治理等團隊更加專注于他們的核心職責,而不是手動管理和處理數據訪問請求。
02
傳統數據共享的問題
數據治理是指監督數據管理的政策和流程。數據治理需要保證數據安全可靠。
傳統上,在數據共享方面,組織傾向于“選擇加入”(opt-in)方法。這意味著默認情況下數據所有者不與組織的其他成員共享數據。
評估過程需要時間。當有其他成員專門請求數據共享時,數據所有者通常會評估共享數據的好處和風險:好處主要是不同類型的業務成果,例如改進的營銷、客戶服務、運營;風險主要是合規和安全風險(例如不符合監管要求或數據泄露)。而這個評估過程需要時間。
技術啟用還需要時間。從數據所有者批準對共享數據集的訪問開始,通常還需要額外時間由數據團隊(如數據工程、平臺和共享數據服務等)在技術上啟用共享,才能真正與數據消費者(如數據科學家、業務分析師、工程師等)共享數據。
03
從“默認知道”到“需要知道”
“默認知道”訪問模式的后果。很多企業,特別是處于高速增長模式時,都采用“默認知道”的數據訪問模式。這意味著以過度授權(甚至是不受控制)的方式訪問數據。這種過度授權通常會在安全和合規風險方面產生問題。
總有一天,企業想要縮小這些授權。而縮小這些授權通常是個很費勁的過程。因為公司不得不設置新的安全控制,創建新的流程,應用新的安全策略。而那些之前已經習慣于免費訪問所有數據的用戶,將只能基于其角色和責任獲得有限的訪問權限。而這個過程必然是痛苦的,比如:
- 生產和分析環境中不斷變化的安全控制,會帶來運營風險和成本。
- 這個過程需要被具有不同目標的多個不同團隊所理解、接受、執行。
- 這個過程通常很難獲得支持,尤其是當業務價值并不總是增長時。一般來說,如果公司不滿足某些數據訪問控制要求,它們將會達到增長上限。
“需要知道”訪問模式。企業的下一步自然是從“默認知道”轉變為“需要知道”。這意味著,在轉變之前,所有(或大多數)數據消費者都可以訪問數據存儲中的所有(或大多數)數據;而現在,基于他們在組織中的角色(如客戶成功、工程師、營銷)和具體職責,他們對數據的訪問將受到限制。其他的例子還包括僅限特定團隊訪問敏感數據、數據匿名化和脫敏,以及應用數據本地化策略。
04
從“需要知道”到“需要共享”
已經看到并且可以預期,已經處于“需要知道”心態的組織,正在意識到,重點應該放在允許組織中更多的數據可訪問性上,并保持共享優先的心態。
為了更好地向“需要共享”范式轉變,組織需要改變思維方式和行為:
1)從風險厭惡到風險調整
風險厭惡(Risk-Averse)策略。許多組織采用風險厭惡的策略,即先試圖緩解所有風險,然后才接受數據共享請求。
風險調整(Risk-Adjusted)策略。但更優的策略是風險調整,即組織直接從數據被共享和處理的位置開始,著手緩解風險。
風險調整策略的一個例子是擁有一個連續的匿名化層,以確保共享的數據被匿名化或脫敏到所需的程度。具有基于角色的脫敏非常重要,這樣客戶成功團隊就可以訪問客戶的出生日期(即月份和日期),這樣他們就可以祝他們生日快樂,但無法訪問出生日期字段的年份;而其他用戶則根本無法訪問出生日期的任何部分,因為他們的工作不需要。
2)從選擇加入到選擇退出數據共享
選擇加入(Opt-In)數據共享:意味著數據所有者默認不共享數據,只是有選擇地共享某些數據。這種方式很容易產生數據孤島。
選擇退出(Opt-Out)數據共享:意味著數據所有者默認共享數據,只是有選擇地不共享某些數據。
共享方式轉變。從“選擇加入”轉變為“選擇退出”數據共享,意味著組織中的數據默認都是共享的,而數據所有者需要決策的是哪些數據不能共享。
數據訪問控制。更加重要的是,數據默認共享隱含了數據訪問控制的要求。也就是說,數據所有者以及其他數據干系人(數據治理、數據安全、數據隱私等團隊)可以并且應該對要共享的數據(尤其是敏感數據)進行訪問限制。
3)從數據所有者手中奪走(部分)權力
數據所有者擁有過度權力。傳統上,數據所有者會收到組織中其他團隊的共享請求,有時會在與他人協商后決定是否共享數據。他們大多是根據風險與價值的衡量,來做出這個決定。而問題在于,數據所有者通常對風險和價值的看法存在偏見。因為數據所有者和數據創建者通常對共享數據所涉及的風險持有狹隘的觀點,而忽視了數據共享所帶來的價值。
組織需要剝奪數據所有者的部分權力。剝奪權力的最佳方式,就是采用上面提到的“選擇退出”模式,即數據默認都是共享的,而數據所有者只能選擇那些不能共享的特定數據集。
4)清晰透明的安全、治理、隱私策略
前面已經提到,在共享數據時,如果不采取必要的控制措施來避免風險,就不可能實現“需要共享”的目標。
要實現這一點,組織需要制定非常清晰的數據共享“參與規則”。這意味著組織需要清楚地了解:
- 持續了解敏感數據的位置。否則,數據暴露風險可能會壓倒數據民主化的愿望。
- 具備敏捷訪問控制的能力。這意味著,即使數據集在整個組織中共享,也只有某些特定組才能訪問PII(個人識別信息)。這通常通過動態數據脫敏等方法來實現。
- 有一個“委員會”(或團隊),可以針對數據共享的限制性做出快速決策,并解決沖突。
- 培訓所有數據干系人(在許多數據驅動型組織中,他們可能是組織的重要組成部分),在數據隱私、數據安全、數據治理等方面。
05
DataSecOps方法
在組織內轉向更加開放的數據共享策略,非常符合DataSecOps(數據安全運營)理念。換句話說,一個組織要想處于數據民主化的態勢,就不得不采用DataSecOps原則,如將安全性嵌入在流程本身中,否則,將無法以自動化方式應用訪問策略來獲得即時數據訪問。
“需要共享”是所有組織處理其數據的恰當方式嗎?不,這種方法可能被視為“純粹數據民主化”。它適用于在DataSecOps方面達到成熟或部分成熟水平的組織。
然而,在數據優先經濟中,一個高階的“需要共享”型組織,必然會對“默認知道”和“需要知道”型組織形成“不公平的優勢”。
而一個好的數據安全平臺,也是一個DataSecOps平臺,無論組織采取“默認知道”、“需要知道”、“需要共享”范式的哪一種,都可以幫助組織增強數據訪問控制并加速數據價值實現。
(本篇完)