資料探勘的功能
特徵化
描述
根據目標類資料的特徵或特性進行彙總。
例子
彙總各班男生身高高於175cm的愛好、身體體質等情況。
區分
描述
相同或者不同類物件同一“現象”進行比較分析得出想要的結論。
例子
今年華東地區為啥橘子比蘋果買的好,分析今年的橘子比蘋果的優勢大?人們的消費水平變化了?人們的吃水果的觀念變化了?
頻繁模式、關聯和相關性分析
頻繁模式:資料中頻繁出現的模式,存在多種型別,包括頻繁項集、頻繁子序列、頻繁子結構。
頻繁項集:一般指頻繁地事務資料集中在一起出現的不同類物件集合,如超市許多顧客一起頻繁購買的是奶粉和尿不溼。
頻繁子序列:如顧客傾向於先購買便攜機,再購買數位相機,然後再購買記憶體卡。
頻繁子結構:可能涉及不同的結構形式如列表、圖、樹等,如果一個子結構頻繁出現則稱它為頻繁子結構。
挖掘頻繁模式導致發現資料中有趣的關聯和相關性。
分類
描述
它找出描述和區分資料類或概念的模型,以便能夠使用模型*預測*類標號未知的物件的類標號。
對已發生過的事物分析得出結論用於推測類似新事物得出”預測”。
匯出模型就需要分類規則:if-then 規則、決策樹(類似於流程)、數學公式或者神經網路。
例子
超市商品售賣情況分為好、中、差三類,你想根據商品特性如價格、產地、品牌、種類來為這三類匯出分類模型。
迴歸
描述
它找出某一情況同一影響屬性影響程度變化的連續”函式“。
例子
想知道蘋果在不同價格的銷量。
分類與迴歸的區別
分類是大概的區分資料,資料值不需要連續主要目的是得到分類模型去對”新事物“進行歸類,而回歸力求得到一個函式,去預測屬性值達到新的值時結果值是多少。
迴歸偏向於資料值,分類偏向于歸類。
聚類
描述
物件根據最大化類內相似性、最小類間相似性的原則進行聚類和分組。
例子
人口集中分佈圖。
離群距點分析
資料集中可能包含一些資料物件,它與資料的一般行為和模型不一致~異常挖掘。
異常挖掘也是有意義的比如就可以通過資料分析及時發現異常,及時預防,避免沒必要的情況。
相關文章
- 資料探勘技術功能有哪些
- 神奇的資料探勘
- 資料探勘者與資料探勘青年的對話(轉)
- 資料探勘的資料分析方法
- 自學資料探勘
- Web資料探勘Web
- 序列資料探勘
- 資料探勘概念
- 資料探勘——認識資料
- 大資料、資料分析、資料探勘的差別大資料
- 資料探勘( TO DO LIST)
- 資料探勘與生活
- 資料探勘概述 (轉)
- 資料探勘方向分析
- 資料探勘技術
- 資料探勘與資料抽樣
- 資料探勘之資料準備——原始資料的特性
- 資料探勘的過程有哪些
- 資料探勘的辦法有哪些
- 資料探勘的步驟有哪些?
- 資料探勘的10種分析方法
- 資料探勘資源彙總
- 《資料探勘:實用機器學習技術》——資料探勘、機器學習一舉兩得機器學習
- 淺談大資料、資料分析、資料探勘的區別!大資料
- 資料:資料探勘綜述彙編
- 資料探勘資料集下載資源
- 什麼是資料探勘??
- 資料探勘實習面試面試
- 使用 Oracle 資料探勘 APIOracleAPI
- 資料探勘能做什麼
- 機器學習、資料探勘及其他機器學習
- 資料探勘概述(又) (轉)
- 重磅 | 資料探勘之父韓家煒:文字語料庫的資料探勘(附視訊+PPT下載)
- 談一談資料探勘的軍規
- 如何提升企業的資料探勘能力
- 有哪些常見的資料探勘方法?
- Python 中的實用資料探勘Python
- 常用的機器學習&資料探勘知識(點)機器學習