教育大資料之資料資產管理系統

qing_yun發表於2022-11-07

兜兜轉轉,眨眼間4個月過去了,資料整合系統和資料開發系統如期正常上線了,突然被告知,我不用打“大資料能力平臺”這個副本了,此刻的心情是複雜的。雖然起初不是很想做這個,但是當做了一段時間後我覺得還不錯,突然又不讓做了,著實有點不舒服,當然這些都不重要了。不過雖然官方副本不讓打了,自己可以嘗試把整個副本的攻略搞完。

接下來開始第三個副本“資料資產管理系統”,剛聽到這個系統名字的時候,還是蠻有信心的,因為四年前曾從0到1做過一個資產管理系統,但是深入瞭解之後發現資產管理和資料資產管理雖然只有兩字之差,但是做的事情卻是千差萬別,接下來一起聊聊“資料資產管理系統” 吧!

01、資料資產

1.1 什麼是資料資產

2020 年 4 月 9 日,中共中央、國務院印發《關於構建更加完善的要素市場化配置體制機制的意見》,文中將資料定義為一種新型生產要素,與土地、勞動力、資本、技術要素並列,共五大生產要素。近年來隨著科技的飛速發展,人工智慧、雲端計算、大資料等技術快速更新迭代,資料呈現爆發式增長,從而進一步成為了構建現代社會必不可少的要素。

伴隨著大資料時代的悄然來臨,資料的價值已被廣泛認同,大家對資料的重視提到了前所未有的高度,資料即資產,已然成為最核心的思維方式。

資料資產是指由企業擁有或者控制的,能夠為企業帶來未來經濟利益的,以物理或電子的方式記錄的資料資源,如檔案資料、電子資料等。在企業中,並非所有的資料都構成資料資產,資料資產是能夠為企業產生價值的資料資源。比如,大家平時網購,生成的每一條訂單資訊就是資料資產。

1.2 資料資產的價值在當下,越來越多的企業開始藉助大資料來進行管理和決策。透過大資料分析和挖掘,企業明確錢該花在哪裡,哪些地方應該多花,哪些地方應該少花,目標客戶在哪裡;企業利用資料刻畫出豐富的客戶資料,然後藉助運營手段來取得競爭優勢。透過對結果資料和過程性資料的跟蹤和分析,降低成本,控制風險,為一線使用者提供更好的產品和服務。

隨著社會的發展,企業對資料的需求會不斷增長,企業對資料的依賴性也會不斷增強,人們可以越來越清楚地評估資料資產的價值。

02、資料資產管理

2.1 什麼是資料資產管理

“資料資產管理”一詞,在國內首次由DAMS(中國資料資產管理峰會)組委會正式提出。中國資料資產管理峰會對資料資產管理的定義為是對資料管理、資料治理及資料資產化的管理過程。

中國信通院釋出的《資料資產管理實踐白皮書》中對資料資產管理的定義是:資料資產管理(DAM,Data Asset Management)是指規劃、控制和提供資料及資訊資產的一組業務職能,包括開發、執行和監督有關資料的計劃、政策、方案、專案、流程、方法和程式,從而控制、保護、交付和提高資料資產的價值。資料資產管理是需要充分融合業務、技術和管理,來確保資料資產保值增值。

2.2 資料資產為什麼需要管理

資料本身價值有限,無法發揮出有效的價值,只有透過一定方式的處理,讓資料真正轉化為企業的資產,才能是資料發揮出真正的價值。比如教育場景下,隨著教育資訊化2.0的不斷深入,學校出現各種各樣的業務系統,作業系統、考試系統、智慧課堂、智慧考勤等等。這些系統在執行過程中產生了大量的業務資料,但是這些資料分散在不同的業務系統中,各系統之間互相隔離,標準不統一,學校也沒有時間和精力去梳理到底哪些系統中有哪些資料,不知道有多少資料,更不清楚哪些資料可以使用。這些業務系統的資料沒有經過處理轉化,僅可以被稱作資料,無法真正稱作資料資產。

2.3 資料資產管理的痛點

儘管“資料是資產”概念已經廣為人知,但“如何管理資料資產”仍然缺少成熟理論以及工具手段。當前存在的問題有:

  • 傳統方式低效:

    傳統資料管理方式無法滿足資料資產的管理要求,沒有相對完善的平臺工具;

  • 資料資源混亂:

    資料資源分佈散亂,缺少統一規劃,難以形成有價值的資料資產;

  • 資料標準缺失:

    資料多樣化,標準不統一,使得不同系統之間的資料整合較為困難;

  • 缺少後設資料管理:

    難以發現資料潛在關係,出現質量問題,無法瞭解資料的來龍去脈。

因此,以解決客戶痛點為業務導向,構建資料資產管理系統成為大資料平臺建設必不可少的一項工作。

03、教育大資料中資料資產管理系統提供哪些能力

資料資產管理系統基於資料目錄盤點資料資源,以統一資料標準為基礎,規範後設資料管理。圍繞資料資源管理、資料標準管理、後設資料管理等核心功能,實現“盤點資料資源,規範資料資產,發揮資料價值”的資料管理目標,為各級教育部門提供一站式資料管理。

資料資產管理的總體目標是釐清資料資產,透過構建資料資產管理支撐架構,規範資料的生成和使用,持續改進資料質量,強化資料管理體系建設,為企業或組織提供高價值的資料服務於資料應用支撐能力。通俗來說就是把分佈在各系統中的資料資源轉化為資料資產而不是資料垃圾。為了實現這一目的我們的需要做:

(1)資料資產盤點:統計彙總資料資產管理系統現階段資料情況,統計維度包括資料來源型別統計、資料量統計、分層資料庫資料量統計、資料量更改趨勢、標準字典統計、後設資料量統計等,展示資料倉儲中資料脈絡資訊, 以視覺化的方式展示。

(2)資料標準管理:透過提供統一的資料標準管理支撐工具,實現資料標準化的統一管理。

(3)後設資料管理:後設資料記錄了資料從產生到消費的完整鏈路,透過資料資產管理的方式,管理元模型以及後設資料的獲取、生成、變更等環節,實現後設資料血緣影響關係的自動分析,有效的維護後設資料的可管理性。

(4)資料資源管理: 基於資料目錄,直觀的展示當前彙集的資料資源情況,展示資料倉儲中資料脈絡資訊,為快速盤點當前資料情況,提供視覺化的支撐。

04、資料資產管理系統如何做

4.1 產品架構

經過和相關客戶進行溝通,以及和公司技術大佬學習,終於搞出來資產管理系統1.0版本的藍圖,見下方:

4.2 功能說明

接下來我們們就一起去看看這每個模組都具體提供什麼功能。

4.2.1 資料資產盤點

(1)資料資產概覽

資料資產概覽提供檢視當前資料資產管理系統中全部資料情況,包含資產在個資產目錄分佈情況、資料倉儲建設情況、資料增長趨勢等等,幫助教育管理者快速有效的瞭解資料建設情況,以便於採取管理手段和制定決策時,實現科學管理精準決策。

(2)資料資產檢視

資料資產檢視支援檢視所有資料資產目錄下的資料資產情況,使用者透過檢視資料資產詳情瞭解每一個資產的具體資訊,當後續工作中需要資料支援時,可以快速有效進行查詢呼叫。

資料資產檢視模組彙總展示資料資產管理系統中全部的資料資產資訊,包含但不限於資料表、api、非結構化資料等等。

(3)資料地圖

透過後設資料刻畫出資料倉儲脈絡,形成資料地圖,展示了資料在倉庫中的走向。支援使用者根據表欄位、表名進行全文檢索,快速定位,支援使用者檢視錶欄位說明、資料變更情況、血緣關係。

透過ETL操作後設資料自動構建出後設資料之間的血緣影響關係,形成物件、物件屬性、任務、作業之間關係資訊,為資產人員提供倉庫資料來源去向視覺化檢視,同時為資料溯源提供可行性支撐。

4.2.2 資料標準管理

(1)資料元管理

資料元管理為客戶提供後設資料新增、編輯、維護的功能,用於業務方標準化管理本業務相關的欄位,用於後期資料的統一管理。包含定義資料元名稱、標識、長度、型別、值域等相關資訊,為物件定義時提供最小的資料單元資訊。

換一種說法,我們也可以稱資料元為欄位標準,就是大家常見的表欄位,比如使用者id在多個表出現,此時各業務系統之間開發人員根據自己的編寫習慣來定義使用者id,可能有的叫uid,有的叫user_id,有的叫userid,為了提高資料的一致性,我們對這些代表相同業務定義的欄位進行統一管理,制定標準來為後續的資料建模提供支援。

(2)標準字典管理

本模組支援使用者對標準字典進行管理,支援使用者編輯已有的標準字典資訊,同時支援在各類標準字典分類下新增標準字典表及字典項,擴充標準字典庫,用於後期對業務資料的標準化管理。資料標準包括不限於國標、部標、行標等。

標準字典類似於我們表中常見的一些可列舉維度欄位,比如年級、學科等等,我們也時常把它們稱作列舉值。年級作為資料元會出現在多張表中,當使用者想要了解年級都有哪些值時,需要找相關人員進行了解,而且大多數我們的開發喜歡對這些欄位給與code編碼,比如1~9對應一年級~九年級。當我們看到年級欄位的值是1時,如果不知道這個對映關係,就很難對資料做出有效分析得出想要的結論。因此透過標準字典管理,對這些可列舉標準進行統一管理。透過標準字典使用者可快速瞭解欄位的列舉值,以便與進行後續分析。

(3)業務術語管理

業務術語管理模組支援使用者對業務術語進行新增、修改、檢視、刪除的操作。透過業務術語管理將業務中一些常見的術語進行統一管理,並且讓業務所涉及的各干係人能夠在工作中達成理解的一致,保證溝通順暢。

4.2.3 後設資料管理

(1)後設資料查詢

支援按關鍵字的全文搜尋,透過後設資料查詢功能可以準確定位後設資料。

(2)元模型管理

基於後設資料管理工具構建符合CWM規範的後設資料倉庫,實現元模型統一、集中化管理,支援新增、修改等功能。

(3)後設資料管理

本模組主要是在資料來源下依託元模型進行後設資料管理,支援對後設資料進行新增、修改、刪除等操作;包括表、檢視、索引、欄位、列族、訊息、ETL等各類元模型下後設資料。同時自動分析出後設資料之間的血緣影響關係,為資料地圖提供資料支撐。

(4)後設資料分析

後設資料分析支援按資料來源檢視已註冊的所有後設資料以及後設資料的血緣影響關係。

血緣分析:

也叫血統分析,採用向上追溯的方式查詢資料來源於哪裡,經過了哪些加工和處理。

常用於在發現資料問題時,快速定位和找到資料問題的原因。

影響分析:功能與血緣分析類似,只是血緣分析是向上追溯,而影響分析是向下追蹤,用來查詢和定位資料去了哪裡。常用於當後設資料發生變更時,分析和評估變更對下游業務的影響。

4.2.4 資料資產目錄

(1)目錄分類管理

目錄分類管理主要支援對資料資產目錄分類進行管理,將資料目錄按多層次分類配置形成樹狀結構,用於分類展示資料資源,實現資料資源的快速檢索。

(2)資料目錄編制

本模組主要支援資料目錄的編制功能,支援對現有資料表和後設資料繫結目錄關係;資料目錄內屬性資訊來自現有的後設資料,將後設資料進行分類管理。

05、資料資產管理系統如何發揮價值

5.1 資料資產價值如何提升

資料資產管理系統主要是為了對資料資產進行更好的管理,以便於提升資料資產的質量,不斷髮揮出資料資產的價值。

對於企業來講資料資產價值最好的體現就是商業變現,所以企業需要不斷去提升資料質量和降低資料成本。透過資料資產管理系統,採取有效的管理手段提升資料質量,降低資料成本來提升資料資產的價值。

5.2 教育場景下資料資產價值

對於教育部門和學校來說,資料資產價值最好的體現是透過資料資產實現精準決策和科學化管理,所以面向教育,資料資產管理系統更加偏向後續的資料服務。透過資料整合系統、資料安全系統、資料質量系統,提升資料覆蓋度,確保資料準確性和完整性,加快資料時效,從而實現資料資產價值的提升。以此來推動教育大資料的不斷髮展。

5.3 教育大資料案例

(1)辦學條件分析

目前全國很多地方都出臺了辦學標準來對學校的辦公條件進行評定,但是由於資料儲存在不同的系統中,而且有很多資料無法由系統直接獲取,導致評定事宜推行起來進度緩慢。

透過資料資產管理系統,我們能夠將學校各個維度的資料採集統計起來,根據辦學條件要求,統計出區域管轄範圍內各學校指標。

透過構建學前/中小學辦學條件模型,輔助教育主管部門發現區域學校共性薄弱項,指導學校達標建設方向。

透過構建學校發展情況畫像,輔助區域及校級管理者發現學前/中小學的薄弱情況,精細化診斷,精確指導具體學校建設及師資建設工作。

(2)招生壓力分析

隨著科技的不斷進步,各城市發展突飛猛進,在這個過程中學校招生問題變得尤為重要,人口不斷的流入流出,需要對當前的學位情況進校有效的預測,以便於在新學年到來之前可以提前規劃好學區的建設。

基於這種情況,我們採集包括教育事業統計、學區資訊、不動產權資訊等資料資產,幫助區域管理者合理劃分、調整學區,安排學校分佈和建設規模規劃,幫助學校管理者確定招生人數、調整學校資源。

(3)大資料精準教學

透過伴隨式採集,將學生日常的作業資料、測驗資料、課堂資料以及一些日常學習行為資料匯聚到一起。透過大資料技術對學生的學習情況進行分析,基於各學科知識點數,生成學生個性化知識圖譜,幫助學生發現問題,並及時提供“個性化”學習所需的資源、資訊和服務。

比如,透過學生各種作答資料的匯聚和題目關聯知識點的情況,得出學生在整個學科知識樹中知識點的掌握情況,同時根據知識點和資源的關聯情況,給學生推薦適合當前階段學習的資源,在資源學習結束之後,再次推薦相關知識點關聯題目情況,從而達到“哪裡不會學哪裡”的效果。

(4)師資力量分析

透過對學校資訊化系統中各類資料的採集,對學校整體師資力量進行分析,並透過視覺化方式直觀的呈現給教育管理者,幫助他們及時獲取下轄學校師資情況,以便於後續教師資源的分配。

比如,一個學校校長每次去區裡彙報工作都訴苦說自己學校教師少,教師資源差,這時候作為上級領導應該怎麼辦。如果沒有有效資料做支撐,管理者可能會感覺無從下手。透過師資力量分析,管理者可以快速瞭解到學校的生師比資訊,以此來判斷學校的教師人力問題,透過專任教師資質分佈,可快速瞭解學校一級教師、二級教師的數量,依次來判斷學校的教師資源水平。當校長再次過來訴苦時,管理者可依靠資料說話,以此來回答校長的問題,從而實現教育的科學管理。

教育場景下,資料資產可發揮價值的地方數不勝數,千言萬語一張圖形容下教育大資料下資料資產如何發揮它的價值。

作者介紹:@奈文摩爾,教育公司資料產品經理;擅長資料應用蟾皮、數倉建設;“資料人創作者聯盟”成員。


來自 “ 一個資料人的自留地 ”, 原文作者:@奈文摩爾;原文連結:https://mp.weixin.qq.com/s/l7w-zEIkNG5jrtXEnEVcbg,如有侵權,請聯絡管理員刪除。

相關文章