<menu id="guoca"></menu>
<nav id="guoca"></nav><xmp id="guoca">
  • <xmp id="guoca">
  • <nav id="guoca"><code id="guoca"></code></nav>
  • <nav id="guoca"><code id="guoca"></code></nav>

    針對電商欺詐檢測系統的“中毒攻擊”

    X0_0X2022-01-05 10:30:57

    幾乎所有高級網絡安全產品的銷售都會告訴你,人工智能已經被用于保護計算基礎設施的許多產品和服務。但是,您可能沒有聽說過機器學習應用程序自身也需要安全防護,而且這些應用在日常服務中變得越來越普遍。

    人工智能應用已經在塑造我們的意識(信息繭房)。大型社交媒體平臺普遍使用基于機器學習的推薦機制讓用戶與平臺保持強關聯、參與內容并投放精準廣告。但很少有人知道,這些系統很容易受到“數據中毒攻擊”。

    對這些機器學習算法的操縱是司空見慣的,并且存在大量在線服務來幫助完成這些操作。而且,執行此操作不需要任何技術技能——只需掏出您的支付寶刷“點贊”、“訂閱”、“關注”、閱讀數、轉發、評論或任何能夠影響算法的數據。

    由于這些攻擊造成的損失仍然難以用金錢量化——而且成本通常由用戶或社會本身承擔——大多數互聯網平臺僅在立法者或監管機構強制要求時才解決其模型的潛在腐敗(或腐化)問題。

    事實上,任何在不可信數據上訓練的模型都可能遭受數據中毒攻擊。近日,F-Secure的資深數據科學家Samuel Marchal介紹了對抗電子商務網站的欺詐檢測算法。如果這種攻擊很容易達成,那么在線零售商就必須重視這個問題。

    什么是數據中毒?

    機器學習模型的好壞取決于用于訓練它的數據的質量和數量。訓練準確的機器學習模型通常需要大量數據。為了滿足這種需求,開發人員可能會求助于可能不受信任的來源,這可能會打開數據中毒的大門。

    數據中毒攻擊旨在通過插入錯誤標記的數據來修改模型的訓練集,目的是誘使它做出錯誤的預測。成功的攻擊會損害模型的完整性,從而在模型的預測中產生一致的錯誤。一旦模型中毒,從攻擊中恢復是非常困難的,一些開發人員甚至可能都不會去嘗試修復。

    數據中毒攻擊有兩個目標:

    • 拒絕服務攻擊(DoS),其目標是降低模型的整體性能。
    • 后門/特洛伊木馬攻擊,其目標是降低性能或強制對攻擊者選擇的輸入或輸入集進行特定的、不正確的預測。

    對欺詐檢測模型的成功攻擊

    研究人員通過與電子商務網站上的欺詐檢測系統類似的示例場景來研究數據中毒攻擊。經過訓練的模型應該能夠根據訂單中的信息預測訂單是合法的(將被支付)還是欺詐(將不被支付)。此類模型將使用零售商可用的最佳數據進行訓練,這些數據通常來自之前在網站上下的訂單。

    針對這種模型的攻擊者可能希望從整體上降低欺詐檢測系統的性能(因此它通常不善于發現欺詐活動)或發起精確攻擊,使攻擊者能夠在不被發現的情況下進行欺詐活動。

    為了對該系統發起攻擊,攻擊者可以向訓練集中的現有數據點注入新數據點或修改現有數據點上的標簽。這可以通過冒充一個用戶或多個用戶并下訂單來完成。攻擊者為某些訂單付款,而不為其他訂單付款。目標是在下一次訓練模型時降低模型的預測準確性,因此欺詐變得更加難以檢測。

    在研究人員的電子商務案例中,攻擊者可以通過延遲支付訂單以將其狀態從欺詐變為合法來實現標簽翻轉。還可以通過與客戶支持機制的交互來更改標簽。通過對模型及其訓練數據有足夠的了解,攻擊者可以生成優化的數據點,以通過DoS攻擊或后門來降低模型的準確性。

    數據下毒的藝術

    研究者用實驗生成了一個小數據集來說明電子商務欺詐檢測模型的工作原理。有了這些數據,研究者訓練了算法來對該集中的數據點進行分類。選擇線性回歸和支持向量機(SVM)模型是因為這些模型通常用于執行這些類型的分類操作。

    研究者使用梯度上升方法基于拒絕服務或后門攻擊策略以最佳方式生成一個或多個中毒數據點,然后研究模型在接受新數據訓練后的準確性和決策邊界發生了什么變化,其中包括中毒的數據點。自然,為了實現每個攻擊目標,需要多個中毒數據點。

    通過中毒攻擊實施電子商務欺詐

    研究者的實驗結果發現,與拒絕服務中毒攻擊(兩者均為100)相比,研究者需要引入更少的中毒數據點來實現后門中毒攻擊(線性回歸為21,SVM為12)。

    線性回歸模型比SVM模型更容易受到拒絕服務攻擊。在中毒數據點數相同的情況下,線性回歸模型的準確率從91.5%降低到56%,而SVM模型的準確率從95%降低到81.5%。請注意,在這種情況下,50%的準確率與擲硬幣相同。

    SVM模型更容易受到后門中毒攻擊。由于SVM模型比線性回歸模型具有更高的容量,因此它們的決策邊界可以更好地擬合訓練集中的異常并在其預測中創建“異常”。另一方面,它需要更多中毒數據點來移動線性回歸模型的線性決策邊界以適應這些異常。

    總結

    該實驗發現,只要攻擊者對機器學習和優化技術有足夠的了解,中毒攻擊就可以很容易地被攻擊者執行。目前已經存在幾個公開可用的庫,以幫助攻擊者創建中毒攻擊。

    一般來說,任何使用第三方數據訓練的機器學習模型都容易受到此類攻擊。攻擊者可以很容易使用中毒攻擊來獲取潛在的經濟利益。

    在研究者的實驗設置中,我們觀察到復雜的模型更容易受到后門攻擊,而簡單的模型更容易受到DoS策略的影響,這表明這些模型從設計上沒有靈丹妙藥來防止所有攻擊技術。鑒于重新訓練對于現實中使用的模型來說非常困難,同時考慮到自動欺詐的較低潛在成本,我們需要增加額外的防御層來保護這些脆弱而重要的機器學習應用。

    為了擁有值得信賴的人工智能,它需要是安全的,但是已經在使用的機器學習算法已經帶來了機器無法自行解決的安全挑戰。

    (來源:@GoUpSec)

    大數據機器學習
    本作品采用《CC 協議》,轉載必須注明作者和本文鏈接
    這篇技術干貨 帶你了解深信服的AI技術
    近日,Mintegral通過了2022年網絡安全等級保護第三級測評,表明Mintegral的信息安全管理能力,已達到國內非銀行機構的最高標準。據了解,Mintegral在算法技術上持續投入,是首批將DCO動態創意優化技術與互動創意相結合的廣告平臺之一。在每次廣告請求篩選廣告時,Mintegral的算法會自動增加一個創意組合維度、產生更多的候選結果,讓Mintegral的投放效率具備一定的比較優勢。
    近年來,移動金融發展迅速,新業態、新模式層出不窮。用戶通過智能手機終端進行投資理財、消費借貸、交易支付等金融業務操作,大大提升了金融業務的便捷性。各商業銀行也都推出了手機銀行、直銷銀行、微信銀行等多元化移動金融渠道。
    近日,國際權威IT研究機構Gartner發布《2022中國網絡安全技術成熟度曲線》報告。快速滿足等級保護要求,為600多朵私有云提供安全資源池服務。可視化的安全監控與態勢感知,統一管理提升運維處置效率。態勢感知建立基于全國的縱橫聯動態勢感知Gartner認為,中國態勢感知技術是安全信息和事件管理平臺的現代、集中和發展版本。數據分類分級對數據安全、數據治理和合規項目至關重要。
    Github滲透測試文檔資料集合
    沒有數據安全就沒有國家安全,數據安全治理作為數據安全體系重要的組成部分引起了各行各業越來越多的關注。從數據環境下海量數據面臨的安全風險出發,結合數據在使用過程中的安全需求,給出了一種動態防御的數據安全治理架構,并對該架構下的關鍵技術進行了研究。該架構能夠為數據安全治理提供體系化安全治理思路,其中的關鍵技術可以為該架構的實現提供有效支撐。 《中華人民共和國數據安全法》(下文簡稱:數據安全法)的正
    數據質量的高度敏感要求,數據質量的優劣極大程度影響AI模型的應用效果,必須進行多維度的質量檢查,以及對實時性高要求,實時數據分析、推薦和預警時,數據源更強調具備實時性接入能力。最后是AI引擎的自我迭代階段。達到AI模型上線后的持續迭代優化。考慮到數據訓練規模擴張,數據類型異構,數據噪聲指數級增加,對此AI 引擎能針對性地進行數據自動發現。
    數據暴政與數據光明
    2022-06-09 11:26:54
    背景:現如今,空前且大規模的人類行為數據的可用性正在深刻地改變著我們所處的世界,經濟學、公共衛生學、醫學、生物學、城市科學等在這一趨勢中都受到影響。各個組織、公民個人正在積極嘗試、創新和改編算法決策工具以了解全球人類行為模式,并為解決社會重要性問題提供決策支持。
    此前,本公號發表過的關于數據要素治理的相關文章包括: 《非個人數據在歐盟境內自由流動框架條例》全文中文翻譯(DPO沙龍出品) 簡析歐盟《數字市場法》關于數據方面的規定 數據流通障礙初探——以四個場景為例 對“數據共享合法化”的分析與思考系列之一:以《關于歐洲企業間數據共享的研究》為起點 對“數據共享合法化”的分析與思考 系列之二 ——歐盟B2B數據共享的案例研究 對“數據共享合法化”的分析與思考
    X0_0X
    暫無描述
      亚洲 欧美 自拍 唯美 另类