數據挖掘方法有哪些

回答數量: 1

一顆小胡椒

458 聲望

CISM-WSE CISP-PTS

數據挖掘方法如下：

神經網絡方法：神經網絡非常適合解決數據挖掘的問題，是由于其具有良好的健壯性、自組織自適應性、并行處理、分布存儲和高度容錯等特性，因此近年來越來越受到人們的關注。
遺傳算法：遺傳算法是一種基于生物自然選擇與遺傳機理的隨機搜索算法，是一種仿生全局優化方法。遺傳算法應用于數據挖掘是因為其具有的隱含并行性、易于和其他模型結合等特性。
決策樹方法：決策樹是一種常用于預測模型的算法，它通過對大量數據進行有目的的分類，從中找到一些有價值的、潛在的信息。它的主要優點是描述簡單、分類速度快，因此特別適合大規模的數據處理應用。
粗集方法：粗集理論是一種研究不精確、不確定知識的數學工具。粗集方法具有不需要給出額外信息、簡化輸入信息的表達空間、算法簡單和易于操作的優點。粗集處理的對象是類似二維關系表的信息表。
覆蓋正例排斥反例方法：覆蓋正例排斥反例方法利用覆蓋所有正例、排斥所有反例的邏輯來尋找潛在規則。
統計分析方法：統計分析方法是指對數據庫字段進行函數關系或相關關系的分析，即利用統計學原理對數據庫中的信息進行分析。常用統計分析方法包括回歸分析、相關分析、差異分析等。
模糊集方法：模糊集方法即利用模糊集合理論對實際問題進行模糊評判、模糊決策、模糊模式識別和模糊聚類分析。系統的復雜性越高、模糊性越強，一般模糊集合理論是用隸屬度來刻畫模糊事物的亦此亦彼性的。
回歸分析：回歸分析分為線性回歸、多元回歸和非線性同歸。在線性回歸中，數據用直線建模，多元回歸是線性回歸的擴展，涉及多個預測變量。非線性回歸是在基本線性模型上添加多項式項形成非線性同門模型。
差別分析：差別分析的目的是試圖發現數據中的異常情況，如噪音數據，欺詐數據等異常數據，從而獲得有用信息。
概念描述：概念描述就是對某類對象的內涵進行描述，并概括這類對象的有關特征。概念描述分為特征性描述和區別性描述，前者描述某類對象的共同特征，后者描述不同類對象之間的區別，生成一個類的特征性描述只涉及該類對象中所有對象的共性。
聚集檢測:將物理或抽象對象的集合分組成為由類似的對象組成的多個類的過程被稱為聚類。由聚類所生成的簇是一組數據對象的集合，這些對象與同一個簇中的對象彼此相似，與其它簇中的對象相異。相異度是根據描述對象的屬眭值來計算的，距離是經常采用的度量方式。
連接分析:連接分析，Link analysis，它的基本理論是圖論。圖論的思想是尋找一個可以得出好結果但不是完美結果的算法，而不是去尋找完美的解的算法。連接分析就是運用了這樣的思想：不完美的結果如果是可行的，那么這樣的分析就是一個好的分析。利用連接分析，可以從一些用戶的行為中分析出一些模式；同時將產生的概念應用于更廣的用戶群體中。
關聯規則:數據關聯是數據庫中存在的一類重要的可被發現的知識。若兩個或多個變量的取值之I司存在某種規律性，就稱為關聯。關聯可分為簡單關聯、時序關聯、因果關聯。關聯分析的目的是找出數據庫中隱藏的關聯網。有時并不知道數據庫中數據的關聯函數，即使知道也是不確定的，因此關聯分析生成的規則帶有可信度。

回答所涉及的環境：聯想天逸510S、Windows 10。

11個月前 / 評論