一文讀懂資料標準中的屬性定義與後設資料的區別

碼農談IT發表於2023-10-31

來源:資料驅動智慧


最近在做專案過程中發現一個問題:有些同事經常把指標資料標準中的業務屬性、技術屬性、管理屬性當做業務後設資料、技術後設資料、管理後設資料或者在資料指標標準定義的時候直接分為業務後設資料、技術後設資料和管理後設資料。這就導致無論是資訊管理的技術部門還是經營管理的業務部門總是一頭霧水,難以釐清。下面我們談談指標資料標準中的屬性和後設資料類別的聯絡和區別。

一、後設資料的定義及分類

參照國際資料管理協會《DMBOK資料管理知識指南》的說法,我們看看後設資料及分類。

後設資料最常見的定義是“關於資料的資料”。後設資料通常分為三種型別:業務後設資料、技術後設資料和操作後設資料。

在資訊科技之外的領域,如在圖書館或資訊科學中,後設資料被描述為不同的類別:

1)描述後設資料(Descriptive Metadata)。描述資源並支援識別和檢索,如標題、作者和主題等。

2)結構後設資料(Structural Metadata)。描述資源及其組成元件之間的關係,如頁數、章節等。

3)管理後設資料(Administrative Metadata)。用於描述管理生命週期的後設資料,如版本號、存檔日期等。

這些類別有助於瞭解定義後設資料需求的過程。

(1)業務後設資料

業務後設資料(Business Metadata)主要關注資料的內容和條件,另包括與資料治理相關的詳細資訊。業務後設資料包括主題域、概念、實體、屬性的非技術名稱和定義、屬性的資料型別和其他特徵,如範圍描述、計算公式、演算法和業務規則、有效的域值及其定義。業務後設資料的

示例包括:

1)資料集、表和欄位的定義和描述。

2)業務規則、轉換規則、計算公式和推導公式。

3)資料模型。

4)資料質量規則和檢核結果。

5)資料的更新計劃。

6)資料溯源和資料血緣。

7)資料標準。

8)特定的資料元素記錄系統。

9)有效值約束。

10)利益相關方聯絡資訊(如資料所有者、資料管理專員)。

11)資料的安全/隱私級別。

12)已知的資料問題。

13)資料使用說明。

(2)技術後設資料

技術後設資料(Technical Metadata)提供有關資料的技術細節、儲存資料的系統以及在系統內和系統之間資料流轉過程的資訊。技術後設資料示例包括:

1)物理資料庫表名和欄位名。

2)欄位屬性。

3)資料庫物件的屬性

4)訪問許可權。

5)資料CRUD(增、刪、改、查)規則。

6)物理資料模型,包括資料表名、鍵和索引。

7)記錄資料模型與實物資產之間的關係。

8)ETL作業詳細資訊。

9)檔案格式模式定義。

10)源到目標的對映文件。

11)資料血緣文件,包括上游和下游變更影響的資訊。

12)程式和應用的名稱和描述。

13)週期作業(內容更新)的排程計劃和依賴。

14)恢復和備份規則。

15)資料訪問的許可權、組、角色。

(3)操作後設資料

操作後設資料(Operational Metadata)描述了處理和訪問資料的細節,例如:

1)批處理程式的作業執行日誌。

2)抽取歷史和結果。

3)排程異常處理。

4)審計、平衡、控制度量的結果。

5)錯誤日誌。

6)報表和查詢的訪問模式、頻率和執行時間。

7)補丁和版本的維護計劃和執行情況,以及當前的補丁級別。

8)備份、保留、建立日期、災備恢復預案。

9)服務水平協議(SLA)要求和規定。

10)容量和使用模式。

11)資料歸檔、保留規則和相關歸檔檔案。

12)清洗標準。

13)資料共享規則和協議

14)技術人員的角色、職責和聯絡資訊。

二、指標資料定義及屬性分類

參照《資料標準化:資料治理的基石》一書,資料指標是說明總體數量特徵的概念,反映了企業的日常經營管理過程。一般從業務屬性、管理屬性、技術屬性等角度制定指標標準。指標的標準化是加強資料治理和管控中最基礎的工作,透過指標標準化,我們可以得到資料的業務價值,技術價值與管理價值。

一般來說,指標分為基礎指標、複合指標和派生指標三類。

一文讀懂資料標準中的屬性定義與後設資料的區別

基礎指標是表達業務實體原子量化屬性的概念集合,是可以直接對單一變數的明細資料進行簡單計算得到的不可進一步拆解的指標。如“收入” 。

基礎指標具有如下特徵:

①指標計算規則中僅包含一個變數。

②其穩定性高,業務定義、計算公式和統計口徑不易隨業務管理視角頻繁變化。

複合指標是建立在基礎指標之上,由若干個基礎指標透過一定運算規則計算形成,在業務角度無法拆解,如“簽約率”、“利潤率”。

複合指標具有如下幾種型別:

①由基礎指標計算得到。

②由基礎指標和複合指標計算得到。

③由複合指標再度計算得到。

維度是報表分割顯示統計數值的角度,主要用來描述在業務活動中會從哪些角度對標準項進行使用和分析,體現為報表的一行或者表頭中的一列。一般來說,維度具有離散化取值的特性,即取值可以列舉。維度作為觀察事物的視角,並不孤立存在,而是透過與指標結合使用,可以對指標的不同方面進行對比與分析。常用維度包括時間、空間、組織機構、業務類別等。

指標資料標準規定了指標資料標準的業務屬性、技術屬性和管理屬性標準,可應用在企業報表編制、資料資產管理等相關領域。

根據資料管控需求和業務運營情況,同時考慮標準的編制參與人員、分期制定過程、標準應用場景等諸多因素設定屬性梳理優先順序,其中由業務人員提供或確認的屬性稱為基礎屬性,需要結合技術人員、管理人員後續進行補充的屬性稱為擴充套件屬性,如下圖虛線框所示。

一文讀懂資料標準中的屬性定義與後設資料的區別

業務屬性:是指標資料在業務層面的定義,描述資料和企業業務相關聯的特性,是資料業務含義的統一解釋及要求。

業務屬性包括:一級主題、二級主題、三級主題、指標名稱、業務定義、處理邏輯、維度、基礎計量單位、參考標準、上報頻度、統計時間、對映型別等。

技術屬性:是指標資料在技術層面的定義,描述了資料與資訊科技實現相關聯的特性,是資料在資訊系統專案實現時統一的技術方面定義。

技術屬性包括資料型別、資料格式、資料來源系統、資料來源表名、資料來源欄位名等。

管理屬性:是指標資料在管理層面的定義,描述了資料與資料管理相關聯的特性,是資料管理在資料標準管理領域的統一要求。

管理屬性包括:指標編碼、資料主責部門、標準管理部門、頒佈日期、廢止日期等。

三、指標資料標準中的屬性分類和後設資料的分類的關係

從背景和功能上說後設資料是描述和解釋資料的,它有自己的功能和作用。而指標資料標準中的屬性分類是為了便於技術、業務和所有者對指標資料屬性的管理而劃分的。兩者的背景和作用是不同的。

從以上的描述我們也可以看出,在資料指標標準中定義的管理屬性不宜用管理後設資料替代,比如主責部門、標準管理部門是業務後設資料的範疇。而管理後設資料往往用在圖書館類似的場景下。所以,為了避免引起歧義和衝突的情況,建議指標資料標準中對於屬性的分類還是用業務屬性、技術屬性和管理屬性。

對於專門從事資料管理的人員來說更應從基本概念和本質釐清不同術語,比如主資料、後設資料、資料元、資料倉儲、資料中臺、大資料、資料湖、湖倉一體、資料網格、資料編織等,這樣才能更好的引導業務一起開展資料管理工作。資料管理不是IT人員唱獨角戲的舞臺,而是需要業務和技術更好協助,理念一致、方法一致、行動一致,才能把資料管理工作做好,更大發揮資料的價值。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70024924/viewspace-2991985/,如需轉載,請註明出處,否則將追究法律責任。

相關文章