基于可學習的高通濾波器和選擇通道的輕量級隱寫分析算法
目前已有惡意分子利用隱寫術并結合惡意代碼等信息安全技術獲取到用戶本身的隱私信息,如果任其發展,甚至會危害客戶的人身安全。基于此,本文提出了一個輕量級的隱寫分析算法,它應用了可被優化的高通濾波器和選擇通道的知識獲取到豐富的隱寫特征信息,從而更有利于隱寫檢測,實驗結果表明本算法具有很好的隱寫性能,具有很好的參考意義。
算法詳解
本隱寫分析算法的網絡總體架構如下圖所示。該網絡包含預處理層,特征提取層和分類層。在預處理層中,應用高通濾波器從圖像中提取出殘差特征信息,然后將殘差特征與選擇信道處理后的特征圖相結合作為輸出。特征提取層由五個卷積層和五個平均池化層組成。最終的分類層由兩個全連接層,兩個Dropout層組成。下面將描述每個層的具體處理。

預處理層
隱寫可被視為向原圖像中加入輕微幅度的噪聲信息,人眼幾乎不能識別隱寫圖像和原圖像之間的差異。噪聲信息改變了相鄰像素之間的依賴性,因此,依據像素間的依賴性可以有效地檢測圖像中是否存在隱寫噪聲信息。現有空域富模型中的高通濾波器可通過計算圖像中的殘差信息來捕獲捕獲隱寫術的噪聲痕跡,因此,在預處理層中應用高通濾波器提取出可表征隱寫信息的殘差特征圖。同時應用選擇通道的知識,有效地計算出不同像素被嵌入隱寫信息的概率,獲取到對應的概率特征圖。最終將這兩種特征圖做求和運算獲取到可信的隱寫信息。
殘差特征圖的獲取
在卷積神經網絡中,殘差信息的提取操作可以通過卷積運算來完成,此時,在卷積運算中選取高通濾波器來初始化卷積核。通常,選擇大小為3×3 或5×5的高通濾波器作為預處理層的卷積核。從空域富模型的五種類別高通濾波器“ 1st”、“ 2nd”、“ 3rd”、“ SQUARE 3 × 3”和“ SQUARE 5 × 5”中選擇五個濾波器分別初始化卷積核。應用“ 1st”、“ 2nd”和“SQUARE 3 × 3”中的高通過濾器初始化后的卷積核的大小3 × 3,應用其余兩種濾波器初始化后的卷積核的大小為5 × 5。由于手工設計的卷積核不一定具有最佳的性能,因此將卷積核加入到卷積神經網絡的學習中,從而使預處理層的卷積核隨著網絡的學習而不斷被優化。
在初始化預處理層的卷積核之前,本文對選定的高通濾波器做歸一化處理進行適當的約束。以SQUARE 3× 3 的濾波器為例,在如下等式中,添加因子將高通濾波器的中心元素更改為-1,同時所有元素值 的 和保持為0。注意,卷積核在訓練過程中會不斷被優化和調整,因此卷積核并不是處于絕對的約束狀態。

以自適應隱寫算法WOW、嵌入率0.4為例,應用五種不同的高通濾波器初始化預處理層的卷積核后,隱寫分析算法的檢測準確率如下表所示。

分析可知,應用SQUARE 3×3高通濾波器初始化后的網絡的檢測準確率高于其他四種,這說明SQUARE 3×3高通濾波器提取的殘差信息更能表征隱寫信息,更有利于隱寫分析。同時,與大小為5×5的卷積核相比,大小為3×3 的卷積核具有較少的訓練參數。因此,選擇空域富模型中的SQUARE 3 × 3 高通濾波器來初始化本文隱寫分析算法網絡的預處理層。
概率特征圖的獲取
為了提升算法隱寫分析的性能,本文應用了選擇通道的知識到卷積神經網絡中。通過選擇通道的理論技術計算出每個像素點的隱寫信息的嵌入概率,以此提升高隱寫概率像素區域的殘差值。
根據已有研究成果,本文應用L1殘差失真范數期望的上界作為選擇通道的計算公式,如下公式所示。





特征圖的匯合操作
根據已有研究知識,已知概率特征和殘差特征圖的匯合方式主要有兩種。第一種方式是使用殘差特征圖乘以經過一定縮放后的概率特征圖,第二種方式將殘差特征圖與概率特征圖直接相加。第二個方式更有利于網絡的匯聚,其提取出的殘差特征可表征更豐富的隱寫特征,因此應用第二種方式作為概率圖的匯合方式,如下公式所示,其中,R表示殘差特征圖,R后面的那個符號表示概率特征圖。

為了更好地查看選擇通道的性能,本文在自適應隱寫算法WOW的三個嵌入率0.2、0.4和1.0下查看應用選擇通道和未應用選擇通道的隱寫分析算法準確率,結果如下表所示。

根據實驗結果可知,應用選擇通道之后,隱寫分析算法的準確率提升了3%-8%,說明選擇通道技術很好地放大了表征隱寫信息的殘差特征,增強了算法的隱寫識別性能。
特征提取層
經過預處理層后,本文算法的網絡生成了一個特征圖,它包含原始的殘差特征圖和概率特征圖。為了更長遠地獲取到隱寫特征信息,并應用它做更好的隱寫檢測分類工作,在特征提取層中,本文應用了五個卷積層來從特征圖中提取隱寫信息。其中,在前個卷積網絡層中,應用了16個大小為3×3的卷積核,在最后一個卷積層中應用了16個大小為5×5的卷積核,同時在每個卷積層后面均添加了一個平均池化操作,以適當地減少網絡的計算量。
分類層
在經過前述網絡層之后,本隱寫分析網絡獲取到了充足的隱寫特征信息,這些特征信息主要包含兩部分,第一部分是直接從圖像中提取出的殘差特征信息,第二部分是通過選擇通道獲取到的隱寫信息嵌入的概率信息。在分類層中,根據這些特征信息計算當前圖像為隱寫圖像或原始圖像的可能性。為了很好地實現上述的功能,本文在分類層中添加了兩部分組件:全連接層和Dropout,將提取出的隱寫特征作為輸入,并輸出分類的結果。
一般來說,卷積神經網絡中絕大部分的參數集中在全連接層中,這些參數能降低網絡的訓練效率,導致網絡過擬合現象的出現。為了降低參數的規模,本文在特征提取層中,設置平均池化的步長為2,以此減小輸出特征圖的尺寸,并且設置卷積核的數量為16。同時,在全連接層中,本文僅僅添加了兩個全連接層,以最大限度地降低了網絡的參數規模。
此外,為了減少過擬合現象的出現,本文在兩個全連接層后添加了Dropout的操作,設置其參數為0.5,這樣即將全連接層輸出的神經元以0.5的概率激活,從而加強了網絡的稀疏性,增強了網絡的泛化能力。
模擬與分析
實驗環境
本文的數據集來自于Bossbase,它包含1萬張大小為512×512的灰度原始圖像,考慮到GPU有限的計算能力,在本文中,縮放原始圖像的大小為256×256。預先生成這些圖像對應于不同自適應隱寫算法的隱寫信息嵌入概率特征圖。在實驗中,本文隨機地將1萬對隱寫圖和原始圖劃分為8000對、1000對和1000對圖像,它們分別屬于訓練集、驗證集和測試集。對于卷積神經網絡,應用Xavier初始化器來初始化特征提取層中的卷積核,對應的偏置值被初始化為零,應用Adadelta梯度下降算法來優化網絡的訓練過程,每批次輸入的樣本量為100,其中包含50張原始圖像和50張隱寫圖像。
結果分析
將本文的隱寫分析模型與傳統的空域富模型SRM、基于深度學習的隱寫分析模型GNCNN作比較,三種隱寫算法的嵌入率均為0.4,隱寫檢測準確率如下圖所示。

根據實驗結果可知,在HUGO、WOW、S-UNIWARD這三種自適應隱寫算法下,本文模型的隱寫分析準確率均遠遠高于基于深度學習的影響分析模型GNCNN,略高于傳統的空域富模型SRM。且在WOW隱寫算法下本文模型的性能最佳,其隱寫檢測準確率高于SRM約6%,但在S-UNIWARD隱寫算法下僅高于SRM約2%。