<menu id="guoca"></menu>
<nav id="guoca"></nav><xmp id="guoca">
  • <xmp id="guoca">
  • <nav id="guoca"><code id="guoca"></code></nav>
  • <nav id="guoca"><code id="guoca"></code></nav>

    用于文本分類的卷積神經網絡

    VSole2021-10-22 04:06:07

    摘要+介紹

    卷積神經網絡(CNN)最開始被應用在計算機視覺,但是后來被研究應用在了自然語言處理里面的語義解析、搜索、語句模型等傳統的自然語義處理任務,并且取得了顯著的效果。使用CNN在預先訓練的詞向量上進行訓練,可以用于句子級分類任務。本文證明了:1.利用僅有少量超參數的CNN在多個NLP任務上取得了較好的成果 2.預訓練的向量是可用于各種分類任務的“通用”特征提取器

    模型

    圖1

    如圖1所示:

    輸入層 圖中最左側是n×k×channel矩陣,表示一句話的n個詞語,每個詞語是一個k維向量;值得注意的是輸入層是多通道的,本文提出了一種multi-channel(見模型變體中的CNN-multichannel)方法,將兩種不同的embedding拼到了一起。

    卷積層 進行卷積操作(圖中第二部分),卷積核的尺寸為m×k×depth,因此每次卷積的時候都是整行整行的進行。m=1時就類似于unigram特征,m=2時類似于bigram特征。采用不同的m進行卷積操作便可以獲得不同的feature map。

    池化層 進行池化操作(圖中第三部分),池化層filter形狀為convLength×1,通過池化操作得到文本的特征表示。

    全連接層+softmax層 圖中第四部分,獲得代表屬于不同類別的概率向量以完成分類。

    數據集

    圖2

    圖2中,c代表分類數量,l代表句子平均長度,N代表句子數量,|V|代表詞匯數量,|Vpre|代表預訓練的詞向量集中包含的單詞數量

    MR Movie reviews(包含正面/負面評論)

    SST-1 Stanford Sentiment Treebank(MR的擴展,包含非常正面/正面/中性/負面/非常負面評論)

    Subj Subjectivity dataset(包含主觀/客觀句子)

    TREC TREC question dataset(將某問題分類為六種類型)

    CR Customer reviews(包含正面/負面評論)

    MPQA Opinion polarity detection subtask of the MPQA dataset

    模型變體

    采用了以下四種模型:

    CNN-rand 所有詞向量都隨機初始化,并在訓練過程中不斷學習

    CNN-static 使用了Word2Vec預訓練向量,未知的單詞則隨機初始化;二者都保持不變,只學習模型的其他參數

    CNN-non-static 同上,但預訓練向量會在訓練過程中進行微調

    CNN-multichannel 具有兩組詞向量(CNN-static和CNN-non-static的兩組向量)

    結果

    圖3

    根據圖3所示,CNN-rand表現不佳,而CNN-static表現十分出色,這說明了使用預訓練的向量可以大幅提高模型性能

    通過CNN-non-static的結果可知,預訓練向量是很好的“通用”特征提取器,可以跨數據集使用對每個任務的預訓練向量進行微調可以進一步提高模型性能

    通過CNN-multichannel的結果可知,CNN-multichannel在小數據集上好于CNN-singlechannel。起初希望通過multichannle的方式避免過擬合,使詞向量盡量不要偏離預訓練的詞向量的同時也使詞向量適應于具體的任務。


    卷積文本分類
    本作品采用《CC 協議》,轉載必須注明作者和本文鏈接
    論文證明了利用僅有少量超參數的CNN在多個NLP任務上取得較好的成果;預訓練的向量是可用于各種分類任務的“通用”特征提取器。
    一.文本分類文本分類旨在對文本集按照一定的分類體系或標準進行自動分類標記,屬于一種基于分類體系的自動分類。牛亞峰老師將傳統的文本分類流程歸納如下圖所示。在傳統的文本分類中,基本上大部分機器學習方法都在文本分類領域有所應用。本文將采用詞向量、TFIDF兩種方式進行實驗。
    從本專欄開始,作者正式研究Python深度學習、神經網絡及人工智能相關知識。一.RNN文本分類1.RNN循環神經網絡英文是Recurrent Neural Networks,簡稱RNN。假設有一組數據data0、data1、data2、data3,使用同一個神經網絡預測它們,得到對應的結果。RNN常用于自然語言處理、機器翻譯、語音識別、圖像識別等領域。本文將采用詞向量、TFIDF兩種方式進行實驗。
    Python人工智能第10篇介紹TF實現CNN圖像分類任務
    針對當前的入侵檢測方法普遍存在準確率與泛化性較低的問題,提出了一種基于卷積神經網絡(Convolutional Neural Network,CNN)和權重縮減門控循環單元(Weight Reduction Gated Recurrent Unit,WRGRU)的網絡入侵檢測模型(CNN-WRGRU)。該模型首先利用 CNN 進行入侵檢測數據集的特征提取,其次利用 WRGRU 來學習數據特征之間的
    根據 MarketsandMarkets 公司 2018 年發布的《安全市場中人工智能》報告,全球人工智能賦能安全市場規模在 2017 年已達 39.2 億美元,預計 2025 年將達到 348.1 億美元,平均每年增長率超過 30%。
    隨著入侵者的攻擊手段日趨智能化、復雜化,傳統的機器學習技術對異常攻擊行為的檢測有效性在下降。近年來,深度學習以其獨特的學習機制,利用大數據和高算力達到學習的高準確率。通過廣泛的文獻調查,目前已經有很多基于深度學習設計的入侵檢測系統。本綜述在對傳統機器學習技術和深度學習技術進行對比后,詳述了基于深度學習和數據集的入侵檢測系統。
    測試結果表明,勒索病毒檢測器檢測準確率達到了 97%,勒索病毒家族分類分類準確率達到了 94%。隨著網絡犯罪的組織化、規模化,隱匿行為攻擊的復雜化和商業化,目前,隱匿高危勒索病毒呈蔓延之勢。為了保證計算機網絡和計算機應用系統的正常運行,電力企業需要對隱匿高危勒索病毒的攻擊作出應對。對抗隱匿高危勒索病毒攻擊,保護用戶數據的關鍵措施在于預防,即在勒索軟件攻入受害者主機但尚未造成實質性破壞前及時檢測并攔截攻擊。
    6G移動通信網絡將通信的領域邊界從物理世界進一步拓展至數字世界,通過在物理世界和數字世界之間提供即時、高效和智能的超連接來重塑世界,這一趨勢將開啟移動通信的新篇章。6G網絡超大規模的全局性連接將給網絡的運營和管理帶來巨大挑戰,亟待革命性的理論和技術創新。
    VSole
    網絡安全專家
      亚洲 欧美 自拍 唯美 另类