目前大數據隱私保護面臨以下問題:
大數據依托的非關系型數據庫缺乏數據安全機制:從基礎存儲技術角度來看,大數據依托的基礎技術是NoSQL。當前廣泛應用的SQL(關系型數據庫)技術,經過長期改進和完善,在維護數據安全方面已經形成嚴格的權限訪問控制和隱私管理工具。而在NoSQL技術中,并沒有這樣嚴格的要求。大數據的數據來源和承載方式多種多樣,數據處于分散的狀態,使企業很難定位和保護所有這些私密數據。NoSQL允許不斷對數據記錄添加屬性,其前瞻安全性變得非常重要,同時也對數據庫管理員提出了新的要求。
社會工程學攻擊帶來的安全問題:社會工程學的特點是不需要專業技術,成本低,效率高。該攻擊與其他攻擊的最大不同是其攻擊手段不是利用高超的攻擊技術,而是利用受害者的心理弱點進行攻擊。因為不管大數據多么龐大總也少不了人的管理,如果人的信息安全意識淡薄,那么即使在技術上防護手段已做到無懈可擊,也沒辦法有效保障數據安全。由于大數據的海量性、復雜性,以及攻擊目標不明確,因此攻擊者為了提高效率,經常采用社會工程學攻擊。
軟件后門:在軟件定義世界的時代,軟件是IT系統的核心,也就是大數據的核心,所有的后門可能都是開放在軟件上面的。據了解,IBM、EMC等各大巨頭生產制造的存儲、服務器、運算設備等硬件產品,幾乎都是全球代工的,在信息安全的監聽(硬件)方面是很難做手腳的。換句話說,軟件才是信息安全的軟肋所在。軟件供應方在軟件上設計了特殊的路徑處理,測試人員只按照協議上的功能進行測試,根本就無法察覺軟件預留的監聽后門。
大數據存儲問題:大數據會使數據量呈非線性增長,而復雜多樣的數據集中存儲在一起,多種應用的并發運行以及頻繁無序的使用狀況,有可能會導致數據類別存放錯位的情況,造成數據存儲管理混亂或信息安全管理不合規范。現有的存儲和安全控制措施無法滿足大數據安全需求,安全防護手段如果不能與大數據存儲和應用安全需求同步升級,就會出現大數據存儲安全防護的漏洞。
文件的安全面臨極大挑戰:文件是整個數據和系統運行的核心。大多數的用戶文件都是在第三方的運行平臺中存儲和處理的,這些文件往往包含了很多部門和個人的敏感信息,其安全性和隱私性自然成為重要的問題。盡管文件的保護提供了對文件的訪問控制和授權,例如Linux自帶的文件訪問控制機制,通過文件訪問控制列表來限制程序對文件的操作。然而大部分文件保護機制都存在一定程度上的安全問題,它們通常使用操作系統的功能來實現完整性驗證機制,因此只依賴于操作系統本身的安全性。但是作為網絡攻擊,操作系統才是最大的一個攻擊點。
大數據安全傳輸的問題:大數據安全傳輸的問題涉及通信網絡的安全、用戶興趣模型的使用安全和私有數據的訪問控制安全,既包括傳統搜索過程中可能出現的網絡安全威脅,比如相關信息在網絡傳輸時被竊聽,以及惡意木馬、釣魚網站等,也包括服務器端利用通信網絡獲取用戶隱私的危險。
大數據支撐平臺云計算安全:云計算的核心安全問題是用戶不再對數據和環境擁有完全且直接的控制權,云計算的出現徹底打破了地域的概念,數據不再存放于某個確定的物理節點,而是由服務商動態提供存儲空間。這些空間有可能是現實的,也可能是虛擬的,甚至可能分布在不同國家及地區。
大數據分析預測帶來的用戶隱私挑戰:從核心價值角度來看,大數據關鍵在于數據分析和利用,但數據分析技術的發展,對用戶隱私帶來極大的威脅。在大數據時代,想屏蔽外部數據商挖掘個人信息幾乎是不可能的。
大數據共享所帶來的安全性問題:我們不知道該如何分享私人數據,才能既保證數據隱私不被泄露,又保證數據的正常使用。真實數據大部分不是靜態的,而是越變越大,并且隨著時間的變化而變化。
大數據訪問控制的安全性問題:訪問控制是實現數據受控共享的有效手段,由于大數據可能被用于多種不同場景,其訪問控制需求十分突出,難以預設角色,實現角色劃分。由于大數據應用范圍廣泛,它通常要被來自不同組織或部門、不同身份與目的的用戶所訪問,實施訪問控制是基本需求。然而,在大數據的場景下,有大量的用戶需要實施權限管理,且用戶具體的權限要求未知。面對未知的大量數據和用戶,預先設置角色十分困難。