大資料探勘,怎樣才能挖掘出有效內容?

候鳥之戀發表於2022-08-01

一、資料探勘的物件:

資料探勘的物件可以是任何型別的資料,社會科學、自然科學、傳統資料庫、物件導向的高階資料庫等等,都可以作為挖掘的物件。

 

二、資料探勘的任務:

資料探勘最主要的目標就是從大量資料中分析出有意義的、自己需要的知識。主要包括分類、預測、時間序列、聚類分析、關聯分析預測和偏差分析等等。

1、分類:按照一定的標準劃分物件型別。

2、預測:按照歷史資料建立模型,用以分析未來走向。

3、時間序列模式:時間序列模式就是根據資料物件隨時間變化的規律或趨勢來預測將來的值。

4、聚類分析:聚類分析是在沒有給定劃分類的情況下,根據資料資訊的相似度進行資料聚集的一種方法。

5、關聯分析預測:關聯分析就是對大量的資料進行分析,從中發現滿足一定支援度和可信度的資料項之間的聯絡規則。

6、偏差分析:偏差分析就是透過對資料庫中的孤立點資料進行分析,尋找有價值和意義的資訊。gendan5.com/zs/hscei.html

 

三、資料探勘的過程:

資料探勘的整個過程包括資料準備、挖掘、模式評估、鞏固知識和運用知識等步驟。

1、資料準備:在進行資料探勘前,必然需要準備大量的資料,這些資料一般來自資料庫系統 ,但並不能直接對其進行挖掘,所以需要先對其進

行清理,將資料噪聲和與挖掘主題明顯無關的資料清除掉,然後轉化為易於進行挖掘的儲存形式開始準備挖掘。

2、資料探勘:資料探勘就是根據資料探勘的目標,選取相應演算法及引數,分析準備好的資料,產生- -個特定的模式或資料集,從而得到可能形

成知識的模式模型。

3、模式評估:由挖掘演算法產生的模式規律,存在無實際意義或無實用價值的情況,也存在不能準確反映資料的真實意義的情況,甚至在某些情

況下與事實相反。因此需要對其進行評估 ,從挖掘結果中篩選出有意義的模式規律。在此過程中,為了取得更為有效的知識,可能會返回前面的某

一處理步驟中以反覆提取,從而提取出更有效的知識。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70014563/viewspace-2908460/,如需轉載,請註明出處,否則將追究法律責任。

相關文章