蘭德:深度偽造技術對信息戰的影響
1、深度偽造內容分類
隨著人工智能技術的發展,越來越多、成熟的人工智能技術開始用于虛假信息活動。深度偽造內容包括深度偽造視頻、深度偽造聲音克隆、深度偽造圖像、深度偽造生成文本4大類。
1.1 深度偽造視頻
深度偽造視頻可以合成或修改視頻中的人臉、表情、身體動作等。合成視頻的圖像主要是通過生成對抗網絡(GAN)生成的。高度逼真的深度偽造視頻需要大量的高端計算資源、時間、金錢和技巧。以2021年抖音國際版賬戶(Tom [@deeptomcruise])上傳的湯姆克魯斯深度偽造視頻為例,在人工智能模型上訓練的時間就花費了2個月。此外,需要一對NVIDIA RTX 800 GPU處理器(單個GPU的售價為5795美元);開發人員還需要一幀一幀地檢查合成視頻中是否有被懷疑的標志,比如眼睛眨的頻率等。
隨著時間的推移,創建深度偽造視頻會變得越來越便宜,所需的訓練時間也會越來越少。同時,生成的視頻質量也越來越高,越來越逼真,變得更加難以分辨和檢測。目前,已經有大量的網站開始提供深度偽造合成服務。

1.2 深度偽造聲音克隆
聲音克隆是深度偽造應用的另一個方向。目前已經有許多在線網站和手機應用可以讓用戶模擬名人的聲音。2019年,欺詐者用深度偽造語音技術合成語音從英國一家能源公司的首席執行官處詐騙了24.3萬美元。2020年,美國費城一用戶稱接到疑似兒子的電話(深度偽造合成音頻),被詐騙900美元
1.3 深度偽造圖像
相比深度偽造視頻,合成深度偽造圖像的成本更低。深度偽造圖像一般以人臉圖片為主,看起來非常逼真,目前就有網站可以生成逼真的本不存在的人臉圖片。下圖是一個領英賬戶的個人簡介,其中使用的照片就是深度偽造圖片。深度偽造圖片越來越多的被用于虛假社交媒體賬戶。

1.4 深度偽造生成文本
通過使用自然語言模型,人工智能還可以生成文本。2020年9月,Guardian就使用OpenAI開發的GPT-3生成了一篇文章。此外,GPT-3機器人還被用于在Reddit社區發帖超過1周時間,平均每分鐘發1個帖。
有專家對此表示擔憂,文本生成程序可能會被外國對手利用來規模化生成基于文本的宣傳材料。對手也可能使用深度偽造文本生成技術就特定主題大規模生成虛假新聞,應用于信息戰中。
2、威脅與影響使用的因素
2.1 威脅
第一,深度偽造內容可被用來操縱選舉。比如,在選舉即將結束時,一個證明候選人丑聞的視頻會對選舉結果帶來影響。
第二,深度偽造內容可被用于加劇社會分裂。俄羅斯就利用虛假內容進行旨在分裂美國公眾的宣傳。
第三,深度偽造內容可降低民眾對政府機構的信任。在偽造的逼真的政府官員視頻加入暴力、種族歧視等內容會大大降低人們對政府機構的信任。
第四,深度偽造內容會侵蝕雜志和可信的信息源。利用高度可信的深度偽造視頻,真實的視頻內容也可能會被誹謗為深度偽造內容。
2.2 限制深度偽造大規模使用的因素
目前,深度偽造仍然沒有大規模使用,主要原因是:
一是考慮到深度偽造的潛在威脅。
二是高質量的深度偽造視頻仍然需要專業人員和工具制作,比如高成本的設備、訓練用的視頻內容、專業的技術人員等。
三是時間因素。用于虛假信息戰的高度逼真的深度偽造視頻制作往往需要數月甚至更長的時間。也就是說,需要提前數月來規劃虛假信息活動。無法做到實時限制了該技術的應用。
四是深度偽造視頻需要大量的訓練數據。高質量的深度偽造需要上萬張圖片用于訓練,這也是目前大多數深度偽造視頻都是名人和政客的原因。
五是虛假信息的“0 day”(零日)。在虛假信息和深度偽造領域,0 day表示對手可以開發一個定制的生成模型來創建可繞過檢測的深度偽造內容。對手想要盡可能長時間地繞過檢測以最大化閱讀量。檢測工具也是在深度偽造內容上建立的,因此對手可能會盡可能地保留生成模型,等到關鍵時刻再使用,比如大選前一周。
六是深度偽造視頻可能會被成功檢測。
3、應對與建議
3.1 檢測技術
目前應對方法:應對深度偽造視頻的主要方法就是:開發和實現可以檢測深度偽造視頻的自動化系統。DARPA資助了兩個與檢測技術相關的項目:Media Forensics項目(2021年結束)和Semantic Forensics 項目(2021財年獲得1970萬美元,2022財年預算請求2340萬美元)。2020年,Facebook啟動了Deepfake Challenge Competition競賽。
建議政策制定者應:收集情報并識別對手深度偽造的技術。使用深度偽造技術的對手會平衡機遇、益處、風險等做出決策。建議美國應當進行兵棋推演,識別可以影響對手決策的威懾戰略。同時,情報機構應收集對手對深度偽造技術和創建深度偽造內容的投入情況相關的情報。投資并加強檢測技術研究。美國政府、研究機構、社交媒體平臺和其他利益相關方應繼續投資并采取措施加強檢測技術。關鍵措施包括創建深度偽造內容庫,內容庫可以促進檢測技術的發展。同時,政府應與私有機構合作推廣可以用于檢測深度偽造視頻的數據集。此外,政府和其他利益相關者還應探索對特定高性能深度偽造檢測器的訪問。
3.2 內容來源展示
目前應對方法:內容來源,即通過內容真實性計劃(Content Authenticity Initiative),Adobe、高通、Trupic、紐約時報和其他參與者提出一種獲取和展示照片源的方法。2022年1月,內容溯源與真實性聯盟 (C2PA聯盟/ Coalition for Content Provenance and Authority)建立了技術標準,指導創建者、編輯、媒體平臺和消費者等實現內容來源的展示。
建議政策制定者應:推廣基于展示的方法。C2PA聯盟已經制定和發布了必要的技術說明,應擴大該技術的使用范圍,確保信息來源的權威性。

3.3 監管措施
目前應對方法:通過監管和刑事立法應對深度偽造相關風險。自2019年以來,美國通過了多個州層面的深度偽造應對法案。在聯邦層面,也提出了多個法案。但目前多個法案仍在提案階段。
3.4 開源情報技術和新聞方法
目前應對方法:開源情報(OSINT)是美國中央情報局(CIA)的一種情報搜集手段,從各種公開的信息資源中尋找和獲取有價值的情報,可以為解決深度偽造問題提供新的方法。這些方法的目標是開發和共享可以用來識別深度偽造和其他虛假信息相關內容的開源工具。
建議政策制定者應:開發新的OSINT工具。來幫助新聞機構、媒體機構和其他非技術專家檢測和開展深度偽造內容研究。
3.5 媒介素養
目前應對方法:媒介素養(media literacy)項目幫助對信息源感興趣的讀者評估其可信性,并對展示的材料辯證地思考,大量證據表明媒介素養訓練可以有效應對傳統形式的虛假信息。
建議政策制定者應:繼續開展媒介素養培訓。促進更大范圍的媒介素養技能和提高媒體應對虛假信息的能力,向受眾警示深度偽造技術就在身邊和深度偽造技術用于虛假信息的可能性。
4.評述
隨著人工智能技術的發展,人工智能技術賦能的深度偽造內容也引來了發展熱潮。深度偽造視頻、音頻、圖像、文本等內容非常逼真,難以區分。蘭德報告分析了深度偽造對政府、民主、社會等帶來的威脅,以及當前限制深度偽造技術大規模使用的6個因素,提出了檢測技術、內容來源展示、監管措施、開源情報技術和新聞方法、媒介素養等5種應對方法,最后為政策制定者提出了5個建議。
目前,全球各主要國家都開始意識到深度偽造內容對國家安全帶來的潛在威脅,并從政策、技術等方面采取了應對措施。蘭德報告提出的深度偽造虛假信息0 day(零日)風險為決策者和技術研究人員敲響了警鐘,因為深度偽造的對抗可能是0 day的,如何實現0 day深度偽造內容檢測可能是深度偽造檢測技術研究的一大挑戰。此外,蘭德在原有深度偽造檢測技術的基礎上,提出的利用內容來源展示、開源情報技術和方法也為深度偽造技術應對提供了新的方向。