大資料系統架構的通用模組有哪些

大資料小知識發表於2022-04-12

  企業要開展大資料相關業務,首先就需要基於自身的需求,來設計搭建資料系統平臺。而大資料系統平臺的搭建,需要基於實際需求,來進行系統架構規劃。下面來對大資料系統架構模組做一個簡單的介紹。

  通常來說,一個大資料系統架構通用的模組包括——

  資料收集模組:主要負責收集各種資料來源的資料,包括日誌檔案、網路請求、資料庫、訊息佇列等,並將這些資料轉換為檔案或者訊息向後傳遞。

  資料轉存模組:主要負責將資料定時傳遞到分散式儲存或者實時傳遞給下游的資料處理程式。

  ETL模組:主要負責資料的清洗、格式和內容的處理和轉換、資料分級分揀、載入至資料倉儲等。

  資料倉儲模組:這是整個架構的核心,資料倉儲是資料有組織的集中儲存的地方,負責資料的存取和管理。

  後設資料管理模組:主要負責記錄和約束資料倉儲中資料的含義和格式,控制著資料的生命週期和資料質量。

  分析引擎模組:資料分析師互動最多的模組,主要負責執行各種分析語句或程式碼,完成各種分析任務。

  作業管理與排程模組:負責分析作業的管理和定時排程,包括作業的增刪改查、檢視修改歷史、設定排程定時和執行引擎等。

  資源分配與排程模組:主要負責在多作業同時執行的場景下,有效協調和分配叢集的資源,使資源利用率最大化。

  大資料系統架構的通用模組有哪些.中琛魔方大資料平臺表示這些模組並不一定每個企業的架構都是如此,始終還是需要基於實際的需求來進行技術選型。這就要求大資料工程師/架構師們,對主流的技術框架要爛熟於心,能不能實現、怎麼實現、實現成本幾何,做到心中有數,能夠結合實際需求來合理地規劃解決方案。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69936596/viewspace-2886676/,如需轉載,請註明出處,否則將追究法律責任。

相關文章