<menu id="guoca"></menu>
<nav id="guoca"></nav><xmp id="guoca">
  • <xmp id="guoca">
  • <nav id="guoca"><code id="guoca"></code></nav>
  • <nav id="guoca"><code id="guoca"></code></nav>

    無監督的12個最重要的學習算法介紹及用例總結

    VSole2022-07-29 16:14:23

    無監督學習(無監督學習)是和監督學習的另一種數據監督機器的方法,無監督學習是沒有的明顯學習數據本身。

    無學習監督算法有幾種類型,以下是其中最重要的12種:

    1、智能識別由相似性將點組成的簇

    k-means是一種流行的算法,數據劃分為k組。

    2、降維算法降低了數據的維數,使可視化和處理更容易

    主成分分析(PCA)是一種降維算法,將數據投影到低維空間,PCA可以使用將數據降維到其最重要的特征。

    3.異常檢測算法點識別異常值或異常數據

    對向支持機可以用于異常檢測(示例)算法[26]。需要方法標注數據集,而無需監督。

    基于[20]個無異常數據監控空間中密集區域的點。

    一個簡單的方法是計算出每個點到最近的鄰居的平均距離。發現點非常可能是異常點。

    還有很多基礎的異常檢測算法,包括離群因子(Local Outlier Factor)和支持相關的數據描述(支持向量域描述)。這些算法可以比簡單的近鄰檢測方法更復雜,通常更復雜例如到的可能出現的某些異常程度[21]。大多數檢測算法都需要對參數進行異常調整,指定一個過高的參數來對異常進行調整。如果參數過低,算法會漏掉異常。算法可能會產生錯誤報告(將正常點識別為異常點)。

    4、分割算法將]數據段或組[12

    分割算法可以將圖像分割為背景。

    這些算法可以在不需要人工監督的情況下將數據集劃分成k-組的距離。這個領域中比較知名的一個算法是手段。 k組。

    一種魯棒的分割算法算法中心是通過另外一種方式,可以通過不同的方式將數據點移向鄰近區域的平均偏移量,實現異常值的處理。在大型數據集上運行它計算可能的價格但是。

    高混合模式(GMM)可以用于最近的模型類型。以前的gmm模型需要計算來訓練它們,但它們的研究進展正在進行中。gmm非常靈活,可以用于數據模型。但有時可以用于任何類型的數據。并且不能總是產生最好的結果。對于數據集,k-means 是一個很好的選擇,而 gmm 則更適合于復雜的數據集。均值偏移可以用于一種簡單的情況,但在任何大型的情況下數據集上計算的價格會漲。

    5、去噪聲濾波器或刪除數據中的噪聲

    小波變換可以使用圖像無發射數據。但包含可能產生的數據損壞、價值和異常值。去電視通過[10]中的噪聲量來提高各種監督學習模型的大小。 。

    現有的成分分析有多種成分,包括主分析(PCA)、成分分析(ICA)和非負成分(矩陣)[11]。

    6、預測網絡節點之間的未來連接預測(例如,預測每個節點之間的未來網絡鏈接)

    預測可用于預測哪些人將成為社交網絡中的朋友。更常用的鏈接預測算法之一是優先連接算法[15],如果預測兩個節點有多個現有連接,則它們更有可能被連接。

    [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [16] [1] [1] [1] 可能“另一種結構”概念,因此在生物網絡中經常使用。

    步行者重啟算法是一種線性預測算法,它模擬網絡上的一個啟動點最后移動的人,在不斷節點[17]中,步行者到達特定節點的隨機排列者。兩個節點之間存在連接。

    7、強化學習算法通過反復試驗來進行學習

    Q-learning是基于值的學習算法[1]的一個它實現簡單且通用。但是Q-learning有時會收斂到次優解[18]。另一個例子是TD learning,它在計算上Q-學習學習要求更高,但通常可以找到更好的解決方案[19]。

    8、生成模型:算法使用訓練數據生成新的數據

    自編碼數據集生成獨特的圖像,可用于從這些數據集生成的圖像。在機器學習中,生成模型屬性是一個捕捉器的數據集的統計模型。所用的訓練的數據一樣。

    生成模型任務各種,模型學習,數據壓縮和像無像一樣使用[很像 22]。生成模型有多種,隱含和可監督的模型機[22]。優缺點,并且適用于不同的任務。

    隱馬爾可夫擅長模型對順序建模,而爾茲曼更擅長對高維數據[22]建模。通過在無標記數據上它們,生成可以用于無監督學習。然后模型訓練,就可以使用這些過程生成新的數據。然后生成的數據可以由人類或其他機器學習算法進行標記。這個可以重復,直到生成模型生成數據,就像想要的輸出。

    9、隨時森林是一種機器學習算法,可用于監督和無監督學習[9]

    對于無監督學習,隨時可以找到類似的學習森林,識別異常值,并壓縮數據[9]。

    和無監督任務經常被證明已被證明使用類似流行的機器學習(如機器)[9]。它們也剛剛過地推廣到這意味著它們可以很好的數據。

    10、CAN是一種基于數據庫的學習算法,可用于無密監督

    它基于,也就是每個點的數量很接近。并且具有一些優勢,它可以找到不同大小的簇,集供不同和用戶預先指定的數量。[23] [28]。沒有類似的數據。例如,它可能會在另外一個數據集上增加一個很好的數據集。 ]。

    11、用于優先選擇關聯、A項4項和順序模式

    四月算法也是第一個關聯規則算法,使用最經典的算法規則。

    Apriori算法有很多種方式,可以根據不同的需求進行定制。例如,可以控制支持度和置信度閾值以找到不同的規則[24]。

    22、Eclat 2019 2019 2019 2019-08-20 2019-08-20 2019-08-08 2019-08-08 2019-08-08 11:24:00 來源: 2019-06-08 11:13:01

    Eclat算法是一種深度優先算法,縱向數據表示,在格理論的基礎上采用基于概念的等價關系搜索空間格)為概念的子空間格(子概念格)。

    以上就是無學習中的算法,如果你對他們感興趣,請詳細查看下面的引用(長,建議查看監督的)

    Q-Learning簡介:強化學習: https ://www.freecodecamp.org/news/an-introduction-to-q-learning-reinforcement-learning-14ac0b4493cc/

    2. Q-learning視頻演練: https ://www.youtube.com/watch?v=4dcgjcuR-1o

    3. 無監督學習:使用 DBSCAN 進行聚類: https ://web.cs.dal.ca/~kallada/stat2450/lectures/Lecture15.pdf

    4.機器學習中的DBSCAN聚類算法: https ://www.kdnuggets.com/2020/04/dbscan-clustering-algorithm-machine-learning.html

    5. 深度生成模型中全局因素的無監督學習。arXiv:2012.08234

    6. Harshvardhan GM、Mahendra Kumar Gourisaria、Manjusha Pandey、Siddharth Swarup Rautaray,機器學習中生成模型的全面調查和分析,計算機科學評論,第 38 卷,2020 年,100285,ISSN 1574–0137, https://doi。 org/10.1016/j.cosrev.2020.100285 。

    7. 提升: https ://aws.amazon.com/what-is/boosting/

    8. 裝袋: https ://www.ibm.com/cloud/learn/bagging

    9. Breiman, L. (2001)。隨機森林。機器學習,45(1),5-32。

    10. Hastie, T.、Tibshirani, R. 和弗里德曼, J. (2009)。統計學習的要素:數據挖掘、推理和預測(第 2 版)。施普林格科學與商業媒體。

    11. 主教,CM(2006 年)。模式識別和機器學習。施普林格。

    12. 功能材料斷層圖像數據分割的機器學習技術。https://www.frontiersin.org/articles/10.3389/fmats.2019.00145/full

    13. 復雜網絡中的鏈接預測:調查。https://arxiv.org/pdf/1010.0725.pdf

    14.鏈接預測。https://neo4j.com/developer/graph-data-science/link-prediction/

    15. 在線網絡中的偏好依戀:測量和解釋。https://arxiv.org/pdf/1303.6271.pdf

    16.一種新的相似性度量,用于挖掘長路徑網絡中的缺失鏈接。https://arxiv.org/pdf/2110.05008.pdf

    17. 帶重啟的快速隨機游走及其應用。https://www.cs.cmu.edu/~christos/PUBLICATIONS/icdm06-rwr.pdf

    18. Q-Learning:教程和擴展。https://link.springer.com/chapter/10.1007/978-1-4615-6099-9_3

    19. 時間差分學習: https ://web.stanford.edu/group/pdplab/pdphandbook/handbookch10.html

    20. 異常檢測的機器學習技術:概述。https://www.researchgate.net/profile/Salima-Benqdara/publication/325049804_Machine_Learning_Techniques_for_Anomaly_Detection_An_Overview/links/5af3569b4585157136c919d8/Machine-Learning-Techniques-for-Anomaly-Detection-An-Overview.pdf

    21. 網絡異常檢測的機器學習方法。https://www.usenix.org/legacy/event/sysml07/tech/full_papers/ahmed/ahmed.pdf?ref=driverlayer.com/web

    22.墨菲,KP(2012 年)。機器學習:概率視角(第 1 版)。麻省理工學院出版社。

    23. 一種基于密度的算法,用于在大空間中發現集群……。https://www.osti.gov/biblio/421283 。

    24. Rakesh、Agrawal 和 Ramakrishnan Srikant。“礦業協會規則的快速算法”。https://www.researchgate.net/publication/2460430_Fast_Algorithms_for_Mining_Association_Rules

    25.帕克,伊克巴爾。機器學習:算法、實際應用和研究方向。https://link.springer.com/article/10.1007/s42979-021-00592-x

    26. 使用多代理系統進行異常檢測。https://users.encs.concordia.ca/~abdelw/papers/Khosravifar_MSc_S2018.pdf

    27. 用于圖生成的深度生成模型的系統調查| 深度人工智能。https://deepai.org/publication/a-systematic-survey-on-deep-generation-models-for-graph-generation

    28. Hierarchical K-Means Clustering:優化集群——Datanovia。https://www.datanovia.com/en/lessons/hierarchical-k-means-clustering-optimize-clusters/

    機器學習無監督學習
    本作品采用《CC 協議》,轉載必須注明作者和本文鏈接
    監督學習監督學習)是和監督學習的另一種數據監督機器的方法,監督學習是沒有的明顯學習數據本身。
    自從chatgpt發布后一直關注如何和網絡安全融合,最近一直在學習GPT相關內容,傳統的用文本向量相似度索引的方式局限太大。2019年GPT2發布,對gpt1架構改動了一下,使用40GB文本,包含web爬蟲數據,redit等數據,模型參數達到15億。使用45T文本,參數量達到1750億,效果炸裂。數據集加載類對每篇文章mask最后一個字用作預測,計算loss用mask第一個字的文本,gpt架構的神奇之處在于此,它只是預測最后一個字,而預測的這個字是根據學習文本的概率計算的。
    這篇技術干貨 帶你了解深信服的AI技術
    當今的網絡安全行業嚴重依賴傳統方法(主要是人工驅動的方法),隨著基于大語言模型的生成式人工智能變革浪潮襲來,首當其沖的網絡安全行業正面臨一次技術和方法的顛覆性革命,不想被淘汰的網絡安全從業人員需要重新點亮技能樹。
    摘要Docker是目前最具代表性的容器平臺之一,它的安全問題引起了產業界和學術界的廣泛關注。首先,對Docker架構以及基本安全特性進行介紹,分析了Docker面臨的安全威脅。由于Docker擁有輕量化、高效率和易部署的特點,目前已被廣泛應用于云計算和微服務架構中。本文對Docker安全相關的研究思路、方法和工具進行比較和分析,并指出未來可能的研究方向。此外,Iptables的限制范圍有限,容器網絡仍然容易受到數據鏈路層攻擊,如ARP欺騙等。
    電力工控系統是關系到電網安全穩定運行的重要領域。目前國網黑龍江電力有限公司已經建立起“安全分區、網絡專用、橫向隔離、縱向認證”的邊界安全防護體系。但在工控系統核心位置保護方面,還需考慮以下兩個問題:電力工控系統具有閉源特性,內部函數邏輯調用非開源;攻擊數據樣本極少,難以構建特征庫引擎。針對以上問題,從系統底層數據提取、運行狀態學習等方面開展研究,設計了涵蓋廠站、主站兩側的安全防御體系架構,為閉源電
    工業互聯網是新一代信息通信技術與工業控制技術深度融合的新型基礎設施,通過對人、機、物、系統等的全面連接,構建起覆蓋全產業鏈、全價值鏈的全新制造和服務體系,為工業乃至產業數字化、網絡化、智能化發展提供了實現途徑。
    本文介紹了三種主要的威脅檢測方法,包括其主要應用場景和優缺點。
    當前工業制造業正朝數字化、網絡化和智能化方向演進,5G、大數據、工業互聯網和人工智能等新一代信息技術與制造業正在加速融合,但同時也給工業自身帶來了很多的網絡安全風險。通過對工業制造當前現狀和發展趨勢進行綜合分析,科學論證其存在的安全挑戰,提出了一種全新的工業信息安全架構,并給出應對建議。
    根據 MarketsandMarkets 公司 2018 年發布的《安全市場中人工智能》報告,全球人工智能賦能安全市場規模在 2017 年已達 39.2 億美元,預計 2025 年將達到 348.1 億美元,平均每年增長率超過 30%。
    VSole
    網絡安全專家
      亚洲 欧美 自拍 唯美 另类