李鳳華:隱私數據共享和泄露間的矛盾永恒存在,隱私計算必將越來越成熟
在監管趨嚴的背景下,隱私計算備受關注,被視為打開數據大規模流通、融合和交易“大門”的鑰匙。作為近年來才被提出來的新技術,隱私計算目前仍處于高速發展和不斷完善的階段。
中國中文信息學會大數據安全與隱私計算專委會主任委員、研究員李鳳華是國際上率先提出隱私計算(Privacy Computing)的學者,他在接受21世紀經濟報道記者專訪時表示,當前,國內個別機構、少數企業為了蹭“隱私計算”熱度,將密碼學領域學者提出的同態加密、安全多方計算等技術納入隱私計算范疇,誤導大家認為所謂的隱私計算技術存在對算力要求過高等問題,同時隱藏了這些技術只適用于局部場景的隱私保護缺陷,并沒有普適性地、全生命周期地保護好隱私數據。
隱私計算是面向隱私信息全生命周期保護的計算理論和方法
21世紀:你如何定義隱私計算?
李鳳華:我于2015年在國際上首次提出隱私計算(Privacy Computing),并在國內外首次正式發表于《通信學報》(2016年第4期)上,給出的隱私計算(Privacy Computing)定義是:面向隱私信息全生命周期保護的計算理論和方法,是隱私信息的所有權、管理權和使用權分離時隱私度量、隱私泄露代價、隱私保護與隱私分析復雜性的可計算模型與公理化系統。
具體是指在處理視頻、音頻、圖像、圖形、文字、數值、泛在網絡行為信息流等信息時,對所涉及的隱私信息進行描述、度量、評價和融合等操作,形成一套符號化、公式化且具有量化評價標準的隱私計算理論、算法及應用技術,涵蓋了全生命周期過程的所有計算操作,支持多系統融合的隱私信息保護。
隱私計算涵蓋了信息搜集者、發布者和使用者在信息產生、感知、發布、傳播、存儲、處理、使用、銷毀等全生命周期過程的所有計算操作,并包含支持海量用戶、高并發、高效能隱私保護的系統設計理論與架構。
我還想強調一點,同態加密、安全多方計算等密碼學領域學者提出的技術并不屬于隱私計算。這些技術只適用于局部場景的隱私保護,并沒有普適性地、全生命周期地保護好隱私數據;同時還誤導大家,引發了所謂的隱私計算技術對算力要求過高等問題。
21世紀:數據的可復制性和可共享性等特征降低了持有方交易數據的意愿,隱私計算是否可化解該難題?
李鳳華:數據的可復制性和共享性是數據交易的本質要素,數據的共享性是通過數據可用性體現出來的。也就是說購買方的數據可用性是數據交易價值的體現。而目前對數據交易的購買方后續是否按照約定去使用數據缺少技術層面的控制機制。
因此,如何在滿足數據可用性的前提下保護用戶隱私,即共享時如何平衡隱私保護和信息損失是隱私保護的重要挑戰,隱私計算的計算框架能夠有效地解決該問題。
21世紀:隱私計算具體在數據交易的哪些環節發揮作用?
李鳳華:數據交易的主要環節包括數據的確權、定價、交易、清算審計等。隱私計算架構的主要環節包括隱私信息抽取、場景描述、脫敏和銷毀等操作、保護方案選擇、保護效果評估、侵權取證與溯源等。
數據交易環節與隱私計算環節的對應關系為:數據確權對應于隱私信息抽取;數據定價對應于場景描述、保護方案選擇、保護效果評估等;數據交易對應于場景描述、脫敏和銷毀操作、保護方案選擇、侵權取證與溯源等;清算審計對應于場景描述、侵權取證與溯源等。
我還想強調的是,數據的一次交易不是全生命周期,數據的多次交易或者多個數據交易所之間的聯動交易才是數據的全生命周期。因此,隱私計算的全生命周期保護理論與方法在數據交易中將發揮不可替代的重要作用。
有效的隱私保護是每個人從數據交易中獲益的前提條件
21世紀:個人是否可以從數據交易中獲益?
李鳳華:在隱私得到充分保護的前提下,數據交易將更加有力地促進服務商提高現有服務的質量和效率,拓展新的業務模式。比如銀行可以利用更多的用戶數據提供精準的征信分析從而簡化貸款流程,導航服務可以提供更為準確的實時交通路況從而規劃更快的路線,這些都可以改進服務體驗,增加服務商的客戶數。服務商還可以從數據交易中獲得其他增值收益,從而促進服務商為用戶提供更多、更好、更廉價乃至免費的信息服務,從而使得所有人間接受益。
但是,如果隱私保護得不好,數據所有者會不愿意共享自身數據,缺少隱私數據將會抑制服務商業務的創新和發展,消費者享受優質、免費服務的機會也會減少。
當然,有效的隱私保護是我們每個人可以從數據交易中獲益的前提條件,可實現個人與企業的雙贏;否則,所有人的利益都將受損,形成個人與企業雙輸的局面。
21世紀:個人擔心在數據交易中被泄露隱私,怎么看待這種擔憂?
李鳳華:數據交易的本質是數據所有權和使用權在不斷的變更,數據頻繁的流通會因保管不善、越權濫用、脫敏防護不夠等因素導致泄露隱私。從這個角度來講,個人擔心在數據交易中被泄露隱私是很正常的,其實質是擔心數據使用者越權濫用,這要依靠數據安全法、個人信息保護法的監管作為最后一道防線。
另外,隱私計算的核心目標是在減少隱私泄露風險的同時,最大限度地提升數據可用性。隱私計算的延伸控制技術能解決跨系統交換過程中數據的受控使用、迭代按需脫敏等問題,延伸控制解決得好,可以促進數據所有者愿意將其數據分享給更多的用戶共享利用,分享的數量多,就能發揮更大的數據價值,還可以降低數據使用方獲取數據的成本。
當然,技術和違規使用是一種攻防博弈,不采用有效技術去處理隱私數據或者違規使用隱私數據的個別企業總會存在,這需要通過網信部門的依法監管來解決。總之,我們不能因噎廢食。
21世紀:強監管會退去嗎?到那時隱私計算還會有發展前景嗎?
李鳳華:新技術的不斷應用促進了網絡泛在智慧互聯,新的服務模式的不斷涌現促進了信息廣泛共享,這些推動了隱私數據的使用不斷拓展,數據現已成為重要生產要素,數據價值也愈加凸顯。因此,因利益沖突,隱私數據泄露的隱患永遠不會消失,隱私數據共享和泄露之間的矛盾是永恒存在的,這與是否有監管無關。
隱私計算作為個人信息泛在受控共享的核心基礎理論,必然會越來越成熟、越來越豐富,各類新技術、新應用的發展也將不斷促進隱私計算技術的螺旋式演進。
21世紀:作為還比較新穎的技術,隱私計算還存在哪些需要完善的地方?
李鳳華: 隱私計算未來需要從六個方面完善和發展:一是要研究隱私計算的基礎理論,包括隱私計算模型、安全保障模型、隱私計算的數學基礎等;二是隱私智能感知與動態度量,包括包含文本、圖片、視頻等多模態數據的隱私信息抽取與感知、適應不同場景的隱私動態度量、隱私度量的量化指標等;三是隱私保護算法,包括隱私脫敏的基本操作算法、隱私保護算法框架、隱私保護算法的保護能力量化指標等;四是隱私保護效果評估,包括效果評估指標、效果評估自動化、基于大數據隱私挖掘的隱私保護效果評估等;五是隱私侵權行為判定與溯源,包括侵權行為判定方法、隱私信息流轉全過程的審計和存證機制、隱私信息流轉的延伸控制機制、隱私侵權行為的追蹤溯源等;六是隱私信息的完備刪除,包括隱私信息傳播過程中多副本的完備發現、刪除指令的通知與確認,刪除效果評估等。