隱私計算在醫療行業的應用
一. 隱私計算背景
我們正身處于一個信息化世界,信息數據已成為當今時代的核心要素。在黨的十九屆四中全會決議通過的《中共中央關于堅持和完善中國特色社會主義制度推進國家治理體系和治理能力現代化若干重大問題的決定》中,我國首次將數據增列為生產要素,要求建立健全由市場評價貢獻、按貢獻決定報酬的機制[1],數據的高效使用及流轉是當前時代發展必不可少的一大環節。為了規范化數據的使用、保障數據的安全,我國在2021年陸續頒發了《數據安全法》和《個人信息保護法》[2][3]。但是隨著社會信息化的進一步深入,數據使用上的安全性事件層出不窮,有關國家重要單位的數據泄露事件也屢屢發生。
那么如何在保證數據合法、安全的前提下實現數據的高效流轉?針對于這個問題,一個新興的技術逐漸走向了大眾的視野——隱私計算。
隱私計算是指在提供隱私保護的前提下,實現數據價值挖掘的技術體系[4],目前主要包括三大核心技術,分別是:聯邦學習(Federated Learning)、安全多方計算(Secure Multi-Party Computation)和可信執行環境(Trusted Execution Environment)。 隱私計算基于同態加密和密碼學底層協議,可以實現“數據可用不可見”的效果,在滿足法律法規和數據安全的條件下,加速數據的流轉。
二.醫療行業信息化現狀及展望
隨著信息化時代的深入,機器學習和深度學習等技術在醫療行業的使用頻率逐漸增加,醫療診斷、治療、康復和監測等環節也逐漸趨向信息化和智能化[5]。據艾瑞咨詢預測,我國2021-2025年區域醫療信息化市場空間復合增長率為27.9%,2025年我國醫療信息化市場空間將達到1245億元[6]。

圖1:2021-2025中國區域醫療信息化市場空間(圖源:艾瑞咨詢)
醫療數據作為一項重要的資產,是醫療衛生領域重要的生產要素,也是反映國民幸福指數的根本依據[7]。但醫療數據往往涉及個人隱私信息,醫療相關人員由于安全性及隱私性等問題,往往不愿共享醫療數據。根據美國HIPPAJournal數據,2009至2020年間,全美共有超過2.68億份醫療記錄遭泄露,這一數字占美國人口的比例超過81.72%[8]。從現實情況來看,大部分醫院不同科室的信息不會直接共享,醫院和基層機構、藥企、醫保等多方數據中心也尚未建立合理的信息共享機制[6]。
體系建設的要求勢必帶來醫療數據的交互利用,而隱私計算則是目前醫療數據合規利用中一項急需應用的技術[8]。
三. 隱私計算在醫療行業的應用場景
根據我們的調研,當前隱私計算在醫療行業主要有四大應用場景,分別是:智慧醫療、醫學科研、藥物研發和醫療保險,下文將對這四大應用場景進行展開討論。
3.1
智慧醫療
智慧醫療指的是通過打造健康檔案區域醫療信息平臺,利用最先進的物聯網技術,實現患者與醫務人員、醫療機構和醫療設備之間的互動[9]。隨著信息化時代的深入和5G技術的完善,智慧醫療在智能診療、遠程手術、智能電子病歷、智慧機器人、移動醫護等領域已有了多個典型的應用[10]。
根據我們的調研,隱私計算在智慧醫療領域主要有3個應用場景,分別是:智能醫學影像分析、智能電子病歷和智能輔助診斷[12]。
3.1.1
智能醫學影像分析
隨著現代醫學發展,傳統醫學影像管理方法已無法適應現代醫學影像管理的要求,無膠片化影像科和數字化醫院已經成為現代化醫療發展的必然趨勢[6]。但目前傳統醫院正在面臨患者多、影像設備多、讀片醫生少等問題。對于醫生而言,每一位患者都需要人工翻閱數百張影像圖片,耗時耗力[11],且每個醫生的經驗、知識水平并不相同。目前來看部分廠商正嘗試利用AI技術輔助醫生進行診斷,但面臨著數據樣本有限、數據質量較低等問題(尤其是罕見病例),因此仍無法對多種類型多種器官病灶進行精準的特征描述,也無法對疾病進行精準的預后評估[11]。
通過利用隱私計算的技術,可以安全有效利用影像學數據進行多中心數據協作,提高訓練樣本數據量和質量,以此提升模型精度和訓練效果[12],從而幫助醫生更好進行輔助診斷。
3.1.2
智能電子病歷
電子病歷是信息技術和網絡技術在醫療領域的必然產物,是醫院病歷現代化管理的必然趨勢,其在臨床的初步應用,極大地提高了醫院的工作效率和醫療質量[11]。但目前大部分醫院面臨著電子病歷數據不開放共享的現實問題,因此醫生臨床診斷的準確率和效率無法得到質的提升。
通過利用隱私計算的技術,可以實現區域內醫療信息的安全共享(如:遠程病患信息的傳輸和共享),在隱私計算平臺之中可以給醫生提供患者各種疾病發生的概率(如傳染病預警信息、危重癥提示信息等),從而幫助醫生更好的對患者進行臨床診療和指導。
3.1.3
智能輔助診斷
上述的智能醫學影響分析和智能電子病歷有著一個共同的重要作用——輔助醫生進行臨床診斷。
在我國信息化高速發展的當下,臨床決策支持系統(CDSS)已進入規模化的應用階段,CDSS已較廣的覆蓋了國內的三級醫院。CDSS是基于人工智能、深度學習等技術,結合醫學知識、臨床案例和患者病情,輔助醫生分析病歷,制定準確有效治療方案的工具,具備減少醫療差錯、提高醫療效率、控制醫療費用支出等優勢[6]。但目前CDSS普遍存在不同醫院數據不共享,信息跨級調用難等問題,因此并不能構建完整、專業的醫療知識庫,從而無法高效地幫助醫生進行輔助診斷。
通過利用隱私計算的技術(主要為聯邦學習),可以在多家醫院數據不出本地的前提下,共同完成模型的建立,實現“數據可用不可見”的效果,實質上發揮各個醫院的數據價值。通過隱私計算,CDSS可以從技術層面上徹底解決數據不共享,信息跨級調用難等問題,從而更好地幫助醫生進行臨床診斷。
3.2
醫學科研
在近代以來,醫學科研高速前進、不斷發展。但醫學科研一直面臨著一大難題——醫療數據難獲取。醫療研究單位由于數據安全、數據隱私等問題,一般不會直接共享自己的醫療數據;同時醫院就診病人的信息也不會直接提供給科研部門。解決醫療數據孤島,是促進醫學研究的關鍵,而隱私計算技術的出現在一定程度上解決了該難題。
通過利用隱私計算的技術,可以實現多個醫學科研單位及醫院數據的安全共享。國外聯邦學習在醫學科研的實際應用已經逐步展開(見圖2[13])。近年來,我國高度重視罕見病病例診療信息登記等相關工作,罕見病相關的政策也陸續發布[14][15][16]。建立一個從罕見病診療登記、數據挖掘研究分析、科研價值和診療方案輸出為一體的隱私計算解決方案,將極大程度滿足醫務工作者、政府職能部門、研究人員工作和科研的需求[11]。對于全基因組關聯分析(GWAS)等這類依賴大樣本量的研究,通過隱私計算,也可以解決單一機構樣本量不足,導致研究結果可信度下降的問題[12]。

圖2 聯邦學習在醫療領域的應用
3.3
藥物研發
新藥研發領域有一個廣為人知的“雙十定律”:研發一款新藥平均需要花費10億美元并歷時10年之久。隨著人工智能的發展,數據對于藥物設計、發現、臨床驗證等各個環節的重要性日益凸顯。不過與全行業相比,任何一家制藥企業、研發機構所擁有的數據量都十分有限,數據量已經成為制約人工智能藥物研發成敗的關鍵因素[17]。
隱私計算可以打破數據孤島、高效利用數據的同時保證數據的安全。合理的利用隱私計算將大大縮短藥物研發的時間,提高研發效率的同時降低研發的成本(輔助新藥研發,進行藥物療效研究、藥物市場分析、藥物副作用研究監測等)[12]。
在2022年,全球10家頂尖藥企宣布攜手合作,利用隱私計算等技術推進新藥的研發(10家藥企分別為:安進、阿斯利康、拜耳、勃林格殷格翰、葛蘭素史克、楊森制藥、默克、諾華等)。這一合作項目,旨在打破不同主體間的“數據孤島”,探索一條數據共享的全新模式——利用多家制藥企業的數據,創建更準確的模型,為藥物開發篩選最有效的化合物[17]。
3.4
醫療保險
隨著我國人口老齡化的加速,我國醫療費用的開銷也在迅速增加,醫保風控一直是一個熱門的研討話題。醫保風控極具挑戰的核心因素在于醫保數據,而醫保數據目前存在質量參差不齊以及數據難共享計算的難題[18]。目前來看,隱私計算是破解該難題的關鍵技術。
通過使用隱私計算的技術,可以實現數據的“可用不可見”,有效整合醫療數據資源,消除“信息孤島”現象,實現不同機構之間數據的安全共享。
四. “數安湖”隱私計算平臺
針對于上一章所述的醫療行業的應用場景,綠盟科技“數安湖”隱私計算平臺憑借著本身的優勢不僅可以滿足業務場景上的需求,而且還具有“更便捷”、“更安全”、“更強大”等優勢,真正做到在滿足法律法規和數據安全的前提下,實現數據的高效流轉,加快我國醫療行業信息化建設的步伐。
綠盟科技在數據安全研究領域積累多年,2022年在隱私計算方向也得到了多方的認可。2022年8月1日,綠盟科技入選為“FATE社區首批成員單位”(首批成員單位共有19家,其中安全廠商僅有兩家)[19];2022年9月9日,綠盟科技入駐華東大數據交易中心(為入駐該交易中心的首個安全廠商)[20]。
2022年9月21日,綠盟科技與海光公司聯合對外發布了隱私計算新產品:“數安湖”隱私計算平臺[21]。通過結合海光獨立研發的可信執行環境CSV(China Secure Virtualization),“數安湖”隱私計算平臺可以在CPU內構造出一個安全的TEE可信執行環境,保證主機管理員或其他用戶無法訪問TEE內的數據,同時“數安湖”隱私計算平臺也支持啟動度量和運行時遠程身份認證,保證運行的是合法的用戶程序。
“數安湖”隱私計算平臺目前覆蓋了聯邦學習、安全多方計算和可信執行環境三種隱私計算的核心能力,具有數據可用不可見、核心數據“拿不走”、惡意行為“跑不掉”等產品特點。在保證數據安全及符合《數據安全法》和《個人信息保護法》等法律的前提下,“數安湖”隱私計算平臺加速了數據的流轉和使用,更加高效化、安全地實現了數據的價值。
五. 總結與展望
我國醫療信息化市場規模正呈逐年遞增的趨勢[6],醫療行業逐漸深入信息化時代的同時,也帶來了許多新的數據安全問題。隱私計算作為實現數據可用不可見的“技術解”,近年來受到了醫療領域的持續關注,根本原因也是因為醫療數據已經進入了必須安全又必須共享的新時代[8]。
然而從現實情況調研來看,目前隱私計算在醫療行業的實際應用可謂鳳毛麟角,一方面是由于隱私計算屬于一個新興的技術,僅有極少數企業推出了基于隱私計算醫療行業成熟的解決方案;另一方面也是由于實際應用方并不清楚隱私計算能給他們帶來的實際價值,從而減緩了隱私計算實際落地的進程。
但我們相信,隨著國家相關法律的頒布和人們對數據安全逐漸的重視,未來隱私計算將會在信息化時代扮演著越來越重要的角色,隱私計算在醫療行業的實際應用也會變得非常普遍。
參考文獻
[1] https://www.ndrc.gov.cn/xxgk/jd/wsdwhfz/202003/t20200310_1222768.html?code=&state=123
[2] http://www.npc.gov.cn/npc/c30834/202106/7c9af12f51334a73b56d7938f99a788a.shtml
[3] http://www.npc.gov.cn/npc/c30834/202108/a8c4e3672c74491a80b53a172bb753fe.shtml
[4] 2019“UN Handbook on Privacy Preserving Computation Technique”
[5] 華佳烽. 面向醫療數據查詢計算的隱私保護方法研究[D]. 西安電子科技大學.
[6] https://report.iresearch.cn/report/202203/3942.shtml
[7] https://www.cn-healthcare.com/articlewm/20220812/content-1417084.html
[8] https://www.cs.com.cn/ssgs/gsxl/202108/t20210831_6200103.html
[9] https://baike.baidu.com/item/%E6%99%BA%E6%85%A7%E5%8C%BB%E7%96%97/9875074
[10] https://new.qq.com/rain/a/20220325A03EP800
[11] https://www.basebit.me/solution1.aspx
[12] https://www.nvxclouds.com/solution/medical
[13] https://doi.org/10.1007/s41666-020-00082-4
[14] http://www.gov.cn/fuwu/2019-02/28/content_5369203.htm
[15] http://www.gov.cn/zhengce/zhengceku/2019-11/13/content_5451656.htm
[16] http://www.gov.cn/zhengce/zhengceku/2020-01/06/content_5466958.htm
[17] https://www.sohu.com/a/554638161_121360292
[18] https://www.163.com/dy/article/G1E3C3HN0531I6Y1.html
[19] https://cn.chinadaily.com.cn/a/202208/16/WS62fb1070a3101c3ee7ae3f3d.html
[20] https://mp.weixin.qq.com/s/HYIIUYgLf-s9VuciPRKcWQ
[21] https://mp.weixin.qq.com/s/fu1lNdK2_jIqa1B4-v6WLw
內容編輯:創新研究院 陳佛忠
責任編輯:創新研究院 陳佛忠
本公眾號原創文章僅代表作者觀點,不代表綠盟科技立場。所有原創內容版權均屬綠盟科技研究通訊。未經授權,嚴禁任何媒體以及微信公眾號復制、轉載、摘編或以其他方式使用,轉載須注明來自綠盟科技研究通訊并附上本文鏈接。