資料探勘能做什麼

maqianmaqian發表於2011-01-25

資料探勘不僅能對過去的資料進行查詢和遍歷,並且能夠對將來的趨勢和行為進行預測,並自動探測以前未發現的模式,從而很好地支援人們的決策。被挖掘出來的資訊,能夠用於資訊管理、查詢處理、決策支援、過程控制以及許多其它應用。資料探勘按其功能劃分主要包括以下幾類:
    (1) 分類

    分類是資料探勘中應用的最多的方法。分類是找出一個類別的概念描述,它代表了這類資料的整體資訊,即該類的內涵描述,一般用規則或決策樹模式表示。一個類的內涵描述分為特徵性描述和區別性描述。特徵性描述是對類中物件的共同特徵的描述,區別性描述是對兩個或多個類之間區別的描述。

    (2) 關聯分析

    若兩個或多個資料項的取值重複出現且概率很高時,它就存在著某種關聯,可以建立起這些資料項的關聯規則。關聯分析的目的是找出資料庫中隱藏的關聯網。在大型資料庫中,這種關聯規則是很多的,一般用“支援度”,“可信度”兩個閾值來淘汰那些無用的關聯規則。

    (3) 聚類

    資料庫中的資料可分為一系列有意義的子集或稱為類。在同一類別中,個體之間的距離較小,而不同類別的個體之間的距離偏大。聚類增強了人們對客觀現實的認識,即通過聚類建立巨集觀概念。

    (4)序列模式

    通過時間序列搜尋出重複發生概率較高的模式,這裡強調時間序列對挖掘結果的影響。

    (5)偏差檢驗

    資料庫中的資料常有一些異常記錄,從資料庫中檢測出這些偏差很有意義。偏差包括很多潛在的知識,如分類中的反常例項、不滿足規則的特例、觀測結果與模型預測值的偏差、量值隨時間的變化等。偏差檢測的基本方法是尋找觀測結果與參照之間的差別。

    (6) 預測

    預測是利用歷史資料找出變化規律,即建立模型,並用此模型來預測未來資料的種類、特徵等。

 

本文來自CSDN部落格,轉載請標明出處:http://blog.csdn.net/chl033/archive/2008/10/19/3102702.aspx

相關文章