大資料分析系統的元件有哪些

大資料小知識發表於2022-03-14

  大資料系統應該包含的功能模組,首先是能夠從多種資料來源獲取資料的功能,資料的預處理(例如,清洗,驗證等),儲存資料,資料處理、資料分析等(例如做預測分析,生成線上使用建議等等),最後呈現和視覺化的總結、彙總結果。

  大資料系統的這些高層次的元件:

  1、各種各樣的資料來源

  當今的IT生態系統,需要對各種不同種類來源的資料進行分析。這些來源可能是從線上Web應用程式,批量上傳或feed,流媒體直播資料,來自工業、手持、家居感測的任何東西等等。

  顯然從不同資料來源獲取的資料具有不同的格式、使用不同的協議。例如,線上的Web應用程式可能會使用SOAP/XML格式通過HTTP傳送資料,feed可能會來自於CSV檔案,其他裝置則可能使用MQTT通訊協議。

  由於這些單獨的系統的效能是不在大資料系統的控制範圍之內,並且通常這些系統都是外部應用程式,由第三方供應商或團隊提供並維護,所以本文將不會在深入到這些系統的效能分析中去。

  2、資料採集

  第一步,獲取資料。這個過程包括分析,驗證,清洗,轉換,去重,然後存到適合你們公司的一個持久化裝置中(硬碟、儲存、雲等)。

  3、儲存資料

  第二步,一旦資料進入大資料系統,清洗,並轉化為所需格式時,這些過程都將在資料儲存到一個合適的持久化層中進行。

  4、資料處理和分析

  第三步,在這一階段中的一部分乾淨資料是去規範化的,包括對一些相關的資料集的資料進行一些排序,在規定的時間間隔內進行資料結果歸集,執行機器學習演算法,預測分析等。

  5、資料的視覺化和資料展示

  展示經過各個不同分析演算法處理過的資料結果。該步驟包括從預先計算彙總的結果(或其他類似資料集)中的讀取和用一種友好介面或者表格(圖表等等)的形式展示出來。這樣便於對於資料分析結果的理解。

  大資料分析系統的元件有哪些.中琛魔方大資料平臺表示大資料分析系統作為一個關鍵性的系統在各個公司迅速崛起,但是這種海量規模的資料帶來了前所未有的效能挑戰。同時,如果大資料分析系統無法在第一時間為運營決策提供關鍵資料,那麼這樣的大資料分析系統一文不值。

  


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69936596/viewspace-2870825/,如需轉載,請註明出處,否則將追究法律責任。

相關文章