淺談大資料、資料分析、資料探勘的區別!

bzxb1188發表於2020-12-19

大資料是網際網路的海量資料探勘,而資料探勘更多是針對內部企業行業小眾化的資料探勘,資料分析就是進行做出針對性的分析和診斷,大資料需要分析的是趨勢和發展,資料探勘主要發現的是問題和診斷。具體分析如下:

 

 

  1、大資料(big data):

  指無法在可承受的時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資產;

  在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大資料時代》 中大資料指不用隨機分析法(抽樣調查)這樣的捷徑,而採用所有資料進行分析處理。大資料的5V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)、Veracity(真實性) 。

  2、資料分析:

  是指用適當的統計分析方法對收集來的大量資料進行分析,提取有用資訊和形成結論而對資料加以詳細研究和概括總結的過程。這一過程也是質量管理體系的支援過程。在實用中,資料分析可幫助人們作出判斷,以便採取適當行動。

  資料分析的數學基礎在20世紀早期就已確立,但直到計算機的出現才使得實際操作成為可能,並使得資料分析得以推廣。資料分析是數學與電腦科學相結合的產物。

  3、資料探勘(英語:Data mining):

  又譯為資料探勘、資料採礦。它是資料庫知識發現(英語:Knowledge-Discovery in Databases,簡稱:KDD)中的一個步驟。資料探勘一般是指從大量的資料中通過演算法搜尋隱藏於其中資訊的過程。資料探勘通常與電腦科學有關,並通過統計、線上分析處理、情報檢索、機器學習、專家系統(依靠過去的經驗法則)和模式識別等諸多方法來實現上述目標。

  簡而言之:

  大資料是範圍比較廣的資料分析和資料探勘。

  按照資料分析的流程來說,資料探勘工作較資料分析工作靠前些,二者又有重合的地方,資料探勘側重資料的清洗和梳理。

  資料分析處於資料處理的末端,是最後階段。

  資料分析和資料探勘的分界、概念比較模糊,模糊的意思是二者很難區分。

  大資料概念更為廣泛,是把創新的思維、資訊科技、統計學等等技術的綜合體,每個人限於學術背景、技術背景,概述的都不一樣。

相關文章