隱私計算,新能源汽車“安全上路”的“救命稻草”?
韓愈《早春呈水部張十八員外》中“天街小雨潤如酥,草色遙看近卻無”一語道盡早春草色。小草一株怎能代表早春生機,綠意一片方顯春意盎然。恰如數據科學家維克托·邁爾·舍恩伯格所言,“大數據讓我們更清楚地看到了樣本無法揭示的細節信息”,從IT(信息科技)時代進入DT(數據技術)時代,數據石油價值日益凸顯。
移動互聯網十年黃金時代已過,下一個移動生態很可能來自“四個輪子”,去年4月特斯拉宣稱其自動駕駛數據累計超過30億英里(約48.2億公里),遠遠超過微博創立10年的數據累積量。車聯網日漸成為車企競爭焦點,數據頻繁跨境、跨系統、跨生態圈交互,然而數據泄露,隱私不“隱”,數據孤島廣泛存在,衍生問題也橫亙在前。
如何保證車輪上這臺電腦能在瘋狂的數據世界保持思考、判斷并作出正確決定?
10月份發布的車聯網數據安全規范,極大地約束了車聯網數據的使用和保護方式。特斯拉的跨境、滴滴事件等同樣鞭打著車企數據合規問題。實現車企從“孤軍奮戰”走向“合作共贏”,確保“數據不出車、數據不出國”同時實現數據共享、安全和隱私?應該說隱私計算是目前助力新能源汽車“安全起飛”的“救命稻草”。
一、區塊鏈隱私保護兩大領域四大象限,各類隱私計算技術均有其更加適用的場景
隱私保護技術是區塊鏈一個重要的發展方向。在技術層面,既有利用加密存儲、去標識化、身份認證等“老辦法”嚴防數據泄露、篡改和不當使用,也有應用多方安全計算、聯邦學習、聯盟鏈等“新方法”實現數據可用不可見(可對數據計算,不知道原始數據)、可算不可識(可用數據計算,不能反推個人身份)。
隱私計算(Privacy Computing)并不是區塊鏈之后才有的,而是一個計算機領域,密碼學的一個重要分支,在不暴露原始數據的情況下完成虛擬的聯合計算。
隱私計算體系架構

資料來源:《騰訊隱私計算白皮書 2021》
隱私計算可分為四個象限:數據流出、集中計算(數據脫敏、差分隱私、同態加密);數據流出、協同計算(安全多方計算);數據不流出、協同計算(聯邦學習平臺)和數據不流出、集中計算(可信執行環境)。
四大象限又可歸為密碼學(軟件和算法)和可信執行環境(硬件)兩大領域。密碼學技術以安全多方計算(Secure Multi-Party Computation, SMPC)為代表;可信硬件領域則主要指可信執行環境(Trusted Execution Environment)。
上世紀80年代,我國第一位圖靈獎獲得者姚期智等人提出安全多方計算,包括隱私集合求交(Private Set Intersection, PSI)、隱私信息檢索(Privacy Preserving Information Retrieval, PIR)及隱私統計分析等。
核心思想是設計特殊的加密算法和協議,在無可信第三方的情況下,互不信任參與方在保護各自隱私信息前提下協同建模的機器學習框架,不能得到其他參與方的任何輸入信息,只能得到計算結果。有秘密共享(Secret Sharing, SS,秘密分割成多片由不同參與方管理)、混淆電路(Garbled Circuit, GC,姚氏電路,明文轉化成布爾電路后對每個門輸出的真值加密)、不經意傳輸(Oblivious Transfer, OT,發送方同時發送多個消息但接收方僅獲取其中之一)等一些強大技術。
可信執行環境通過硬件技術對數據進行隔離保護。核心思想是借助硬件CPU芯片,構建獨立于操作系統的可信的、隔離的機密空間。通用性、易用性和性能比純軟件方案高。缺點是需要引入英特爾、AMD等芯片可信方。此外由于CPU相關實現屬于TCB,側信道攻擊也是不可忽視的攻擊向量。常用兩種方案:Intel 的 SGX、ARM 的 TrustZone,以及與兩者相關的商業化實現方案,如百度MesaTEE、華為 iTrustee 等。
以上兩種隱私計算路徑還衍生出后起之秀——聯邦學習(Federated Learning,FL)等技術。聯邦學習本質是分布式的機器學習,可以從技術上解決數據孤島問題,數據擁有方不出本地構建共有模型,包括聯邦學習、共享學習、知識聯邦、聯邦智能等。根據數據集的不同類型,聯邦學習分為橫向聯邦學習(特征重合較多樣本重合較少的數據集)、縱向聯邦學習(樣本重合較多特征重合較少的數據集)與聯邦遷移學習(樣本和特征重合均較少的數據集)。
2012年就有學者發表了相關研究成果,2016年谷歌率先商用,2018年微眾銀行引入國內,很快得到互聯網大廠、科技巨頭、人工智能公司的重視。
零知識證明(交易匿名和金額隱藏)、差分隱私(Differential Privacy, DP,添加噪音去除個體特征以保護用戶隱私)等輔助性技術或應用也非常有用。
由于技術路徑不同,各類隱私計算技術均有其更加適用的場景:多方安全計算不依賴硬件且安全性更高,但是僅支持相對簡單的運算邏輯,比如簡單的統計、查詢計算和簡單的邏輯回歸等機器學習模型。可信執行環境性能和算法適用性更好,但是需要依賴硬件;聯邦學習適合數據挖掘,可以解決復雜的算法建模問題,但是性能存在一定瓶頸。
二、四小龍領跑政策驅動、市場需求催生的新賽道,八大類參與方中初創中立平臺型企業或大有可為
區塊鏈、金融科技等風口逐漸落下,數據經濟似乎成了為數不多充滿想象力的創投賽道,數據隱私保護是解放數據經濟,實現大規模商業化變現的關鍵一環。
隱私計算成為2021年重點深挖的9項技術之一。據 Gartner 預測,2025年一半的大型機構會使用隱私計算在不受信任的環境和多方數據分析中處理數據。KPMG 預計 2023 年國內數據安全技術服務有望達100-200億人民幣,隨著 IT 架構走向云化,將撬動千億級的數據安全 SaaS 運營收入。常春藤資本創始合伙人翁吉義直言隱私計算行業蘊含大機會,全球都是增量市場,有成長出多家獨角獸的可能。
隱私計算往往涉及四種參與角色,數據供應方、數據需求方、監管方、技術服務商。通常四種角色分離,但某些場景下機構可能兼兩種角色。
國外隱私計算創新活躍,但商業化進展稍緩,各國際企業相對更關注基于可信執行環境的隱私計算,谷歌(聯邦學習的引路人)、Intel(Intel的SGX和ARM的TrustZone壟斷TEE硬件)、微軟(多方安全計算)等國際領軍企業開創了隱私計算產業的時代潮流;Facebook、Zama、Enigma、Sharemind、Privitar等國外互聯網、AI、區塊鏈企業也加快布局。
隱私計算在我國是非常新的行業,相比國外早在2008年便有企業布局,國內直到2016年才出現獨立的隱私計算商業項目。2018年阿里、騰訊、百度等巨頭才相繼入局。2020年,公司數量才從最初的五家變成今天的上百家,形成互聯網大廠、云計算、人工智能、區塊鏈、大數據網絡安全公司、三大電信運營商、金融機構和金融科技企業、隱私計算初創企業為代表的八大類市場主要參與者。

華控清交、螞蟻金服、微眾銀行、翼方健數被譽為領跑隱私計算賽道的“四小龍”,撐起“四超多強”的競爭格局。
從技術路線上看,多方安全計算復雜度高、開發難度大,以華控清交、富數科技、矩陣元等為代表的隱私計算初創企業和大數據區塊鏈企業為主;可信執行環境較強依賴硬件及國外芯片,國內產品相對較少,集中于百度、阿里巴巴等互聯網大廠和沖量在線、隔鏡科技等初創企業;聯邦學習,由于機器學習類應用需求突出,且有較成熟的開源社區為基礎(PySyft、TF-Federated和FATE等),開發難度相對輕松,主要集中在運營商、微眾銀行等金融科技公司。
隨著我國第一部數據安全的專門法律——《中華人民共和國數據安全法》和第一家國際數據交易所(簡稱“北數所”)相繼宣布成立,隱私計算或迎互聯網大廠、垂直初創企業和相關安全領域企業硝煙四起的“三國大戰”。這場“大戰”不是“燒錢”的營銷競爭,而是技術創新的真正比拼,更離不開與商業模式的結合。
政策驅動、市場需求催生的新賽道,初創中立平臺型企業或大有可為
與社區團購、生物醫藥等大廠占據絕對優勢的賽道不同,隱私計算初創企業的市場份額更大。由于技術復雜常常呈現“黑盒化”現象,且處理對象常涉及敏感數據資產,隱私計算眾多技術仍處于前期驗證階段,提供方須首先建立信任,行業較長時間內定制化需求較高,相較于傳統大廠,初創專精型企業天然帶有信任優勢,中立廠商大有可為。
隱私計算廠商落地情況由此可見一斑,根據中國信通院,目前超過81%的隱私計算產品進入到試點部署或實施階段,但是華為等知名企業均尚未公開落地案例,字節跳動等僅僅在集團內部落地。
初創企業技術落地明顯優于傳統大廠,除洞見科技外,星云Clustar、華控清交、翼方健數等大部分均已實現案例落地。專利數方面初創企業同樣表現不俗,專利數超過20個的10家中分別為螞蟻科技(429)、微眾銀行(316)、平安科技(62)、華控清交(49)、百度(33)、矩陣元(33)、騰訊(32)、華為(32)、星云Clustar(25)、趣鏈(24)。
富數科技、同盾科技、星環科技等大數據和網絡安全公司也缺乏落地項目。上市公司2019年靠區塊鏈概念在二級市場尋求回報增長,此次也難逃因為生存壓力炒作新熱點、新風口之嫌,8家區塊鏈公司表示正在或即將開展隱私計算相關業務,但大部分還處于初期階段。不過Real AI、醫渡科技等AI企業確有明確的落地場景,缺乏數據訓練的AI注定只能停留在理論層面,隱私計算也被稱為“AI落地的最后一公里”。
隱私計算研究跨度門檻高,“隱形冠軍”價值更加凸顯。不可否認是隱私計算在挑選公司,而不是公司在挑選隱私計算,需要掌握數學、加密學、建模、工程化和業務場景等綜合能力,以及前期論文研究、底層算法、原型實現和工具化等高投入,國內具有完全自主研發能力的公司屈指可數。軟件產品門檻低賣不動,硬件門檻高玩不起,隱私計算的商業模式仍需探索。
據KPMG《隱私計算行業研究報告》,技術服務商有銷售模式(一次性技術系統搭建每單數十萬數百萬不等)、服務模式(隱私計算年度系統維護和服務比一般軟件更新更快),調用模式(單次數據使用幾分到幾角不等,亦可先試用后收費)、分潤模式(與客戶聯合運營分潤)。
我們預計隱私計算商業路徑分“三步走”:初期以醫療、金融、政務等數據合規關鍵領域的軟件銷售模式為主,中期拓展到中小企業和科技公司的按量付費模式,未來平臺型的調用和分潤模式將解決不同廠家技術不同的問題,相比單純售賣軟硬件的方案,平臺不僅邊際成本更低,還將打開更大的隱私計算生態網絡。
平臺型機會往往誕生于雙邊主體分散、需求多元的行業,網羅上游數據源和下游數據需求,方顯超大規模的隱私計算平臺價值。
華控清交首席科學家徐葳說過,應用跑向數據會形成天然的“數據壟斷”。中立平臺型隱私計算公司像大禹治水一樣“開渠引水”,連接“河系、網道”,建立國家數據網,讓數據跑向應用,真正化解“數據壟斷”。
從投資機構布局來看,紅杉中國、IDG資本、基石資本等不少VC、PE已入局。據天眼查,2020年至今,至少已有8家隱私計算企業獲得融資,大多集中在B輪及之前。榜首是B輪專攻政務的“清華姚班”華控清交,融資額高達5億人民幣,其次是專攻醫療B輪的翼方健數和專攻金融A+輪的星云Clustar。
沖量在線在2020年末完成IDG資本的天使輪投資,锘崴科技、數牘科技等也深受資本青睞。賽道玩家估值多在1~3億元區間,明星公司估值半年前已超6億元。公司成立時間都較短,除華控清交、翼方健數、星云Clustar成立超3年外,其他公司成立時間均不到兩年。
愿意高價入場的投資者多半相信“平臺的傳說”,但杠桿的另一半是隱私計算技術需要彼此結合使用才能滿足客戶的綜合需求,方案同質化意味著市場發展到下一階段—企業價格戰。
而且,由于難以在二級市場找到直接對標的公司,很難預判是百億級的投資機會。隱私計算要突破商業化的規模瓶頸,仍需完善技術的成熟度與安全性,提供同質化產品之外的附加價值,在一個或多個領域提供更深入的解決方案,搭建產業推廣的多方協同合作模式。
三、車聯網時代,隱私計算如何成為下一代移動生態的“基石”
隱私計算應用場景不斷擴展,可以幫助機構在不輸出原始數據的基礎上,共享整合多機構間、多維度的數據,構建更立體的用戶畫像,比如,醫療、金融、電信運營商、互聯網企業獲客提升用戶體驗和政務領域社會福利最大化。
智能聯網汽車有望成為繼醫療、金融和政務之后另一大重點領域,隱私計算將作為數據經濟的底座,開啟下一代移動互聯網紅利,為新能源汽車實現車內、車與云平臺、車與車、車與路、車與人等全方位網絡鏈接與智能管理的車聯網技術體系保駕護航。
過去5年,黑客攻擊智能汽車的次數增長了20倍。一輛汽車每天至少收集10TB的數據,一旦遭受侵害會泄露車上用戶甚至車外行人的信息。在行駛過程中涉及周圍交通情況等大量地理信息,事關國家重大安全。
智能網聯汽車“明星”品牌特斯拉就曾被找出大量安全漏洞,控制者利用Model S的漏洞遠程控制開鎖、鳴笛等操作。
車聯網信息安全分四個層面:系統安全、應用安全、網絡安全,最大問題就是數據安全,也就是數據隱私保護和數據可靠性這對矛盾問題。
車聯網的隱私比移動互聯網的隱私問題更突出,很容易跟蹤車的行蹤、位置和用戶ID等。但是隱私保護下無法了解真實身份,就可能發布虛假信息,帶來數據可靠性問題。
隱私計算結合AI、區塊鏈、云計算、分布式存儲等技術為解決隱私和數據可靠性這個車聯網數據安全最大的矛盾問題提供了方向:
車聯網不可篡改的信息,比如交通事故、違章等信息通過區塊鏈實現證據固化,這是區塊鏈的不可篡改性。
云計算解決車聯網使用區塊鏈時的資源受限傳輸延遲等一系列挑戰,極大提高算力資源利用率,租用計算資源避免重復購買的浪費,規模效應降低單位成本。
分布式計算是云計算的高級形態,車輛等設備通過分布式計算網絡重新被有效利用,防止云計算寡頭壟斷計算資源,提高價格獲取高額壟斷利潤,P2P下載可以節省近60%的帶寬。
AI是自動駕駛的首選技術,汽車不僅僅是交通工具,更是智能設備。而缺乏數據訓練的AI注定只能停留在理論層面上,隱私計算的出現為這一問題提供了解決的方向。
車聯網入網注冊需要保護隱私,隱私計算可以讓數據在分布式計算中保持加密狀態,提高數據安全,也使隱私數據上鏈成為可能,同時通過區塊鏈確保可驗證性。
四、結束語:螺旋上升的飛輪迎來下一代移動生態
分布式計算為車聯網提供存儲的土壤,數據直接從需求節點發送到不受信任的提供節點相比云計算面臨更大的數據安全挑戰。
隱私計算為無限擴容的分布式高性能算力互聯網提供信息安全保證,區塊鏈通過數據目錄、數據湖構建數據流轉,成為隱私計算的底座和樞紐。數據存儲在數據庫里不能直接產生價值,通過AI海量數據訓練才能達到理想性能。隱私計算使數據“不出庫”就能實現身份認證、可追溯性、隱匿查詢、模型構建等能力,將極大的豐富下一代移動生態的應用天地。