大資料視覺化分析的步驟有哪些

大資料小知識發表於2022-06-29

  資料視覺化起源於圖形學、計算機圖形學、人工智慧、科學視覺化以及使用者介面等領域的相互促進和發展,是當前電腦科學的一個重要研究方向,它利用計算機對抽象資訊進行直觀的表示,以利於快速檢索資訊和增強認知能力。

  資料視覺化到底能幹什麼呢?資料視覺化系統並不是為了展示使用者的已知的資料之間的規律,而是為了幫助使用者通過認知資料,有新的發現,發現這些資料所反映的實質。

  從技術上來說,大資料視覺化的實施步驟主要有四項:需求分析,建設資料倉儲/資料集市模型,資料抽取、清洗、轉換、載入(ETL),建立視覺化分析場景。

  一、需求分析

  需求分析是大資料視覺化專案開展的前提,要描述專案背景與目的、業務目標、業務範圍、業務需求和功能需求等內容,明確實施單位對視覺化的期望和需求。包括需要分析的主題、各主題可能檢視的角度、需要發洩企業各方面的規律、使用者的需求等內容。

  二、建設資料倉儲/資料集市的模型

  資料倉儲/資料集市的模型是在需求分析的基礎上建立起來的。資料倉儲/資料集市建模除了資料庫的ER建模和關係建模,還包括專門針對資料倉儲的維度建模技術。維度建模的關鍵在於明確下面四個問題:

  1.哪些維度對主題分析有用?

  2.如何使用現有資料生成維表?

  3.用什麼指標來"度量"主題?

  4.如何使用現有資料生成事實表?

  三、資料抽取、清洗、轉換、載入(ETL)

  資料抽取是指將資料倉儲/集市需要的資料從各個業務系統中抽離出來,因為每個業務系統的資料質量不同,所以要對每個資料來源建立不同的抽取程式,每個資料抽取流程都需要使用介面將後設資料傳送到清洗和轉換階段。

  資料清洗的目的是保證抽取的原資料的質量符合資料倉儲/集市的要求並保持資料的一致性。

  資料轉換是整個ETL過程的核心部分,主要是對原資料進行計算和放大。資料載入是按照資料倉儲/集市模型中各個實體之間的關係將資料載入到目標表中。

  四、建立視覺化場景

  建立視覺化場景是對資料倉儲/集市中的資料進行分析處理的成果,使用者能夠藉此從多個角度檢視企業/單位的運營狀況,按照不同的主題和方式探查企業/單位業務內容的核心資料,從而作出更精準的預測和判斷。

  大資料視覺化分析的步驟有哪些.中琛魔方大資料平臺表示隨著社會的發展,大資料視覺化新的工具和圖表型別也不斷出現,每種都試圖創造出比之前更有吸引力、更有利於傳播資訊的圖表,所以,視覺化專案應該自己去親自感受總結方法,以及享受過程步驟,這樣才能更加易懂。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69936596/viewspace-2903328/,如需轉載,請註明出處,否則將追究法律責任。

相關文章