來源:談資料 作者:石秀峰全文共 4596 個字,建議閱讀 12 分鐘
在聊資料治理的需求時,經常會聊到以下問題:
我想知道企業到底有多少資料,他們都在哪裡?
我想知道企業的資料哪些價值高,哪些價值低?
我想知道哪些部門經常使用資料,以及使用哪些資料?
我想知道哪些資料的採集任務會經常出現問題?
我想知道哪些資料是符合資料標準的,而哪些是非標資料?
我想知道增量資料對儲存空間的影響,現有儲存是否需要擴容?
我關注的資料為什麼需要從多個渠道才能拿到?
我關注的資料有問題,為什麼不能主動預警?
我提的一個資料需求,為什麼IT響應的這麼慢?
……
沒錯,遇到以上問題,給你的資料治理建一個“門戶”就對了!今天跟大家聊一聊什麼是資料門戶,以及資料門戶怎麼建。
01 資料門戶概述
門戶,英文名字:Portal,多麼形象、多麼直觀!
從這個名字上就不難看出,門戶就是為你開啟一個認識新世界的視窗。Portal原意是指正門、房屋的出入口,現在更多用於網際網路的入口網站,是指整合了多樣化內容服務的Web站點,又稱為網路門戶。例如,大家都熟悉的搜狐、新浪、網易、騰訊……
門戶(Portal),對我而言是再熟悉不過了!早在10多年前,我作為企業門戶產品經理,就與Poral結緣了。當年,SOA興起,Portal作為SOA家族的重要成員,在企業資訊化的舞臺之上是一個非常耀眼的明星。不過當時國內真正意義上的企業門戶產品幾乎沒有,統治企業級Portal應用市場的一直是國外巨頭IBM和Oracle。那時候,國內一些大型的央企、國企幾乎清一色的用是 IBM WebSphere Portal 和 Oracle weblogic Portal。剩下一些中小型企業,乾脆把OA當做了門戶去用,因為實施一套國外的門戶產品真的很貴。在這個背景下,我作為產品經理帶著產品團隊基於開源框架研發了公司自己的企業門戶產品,並且很快形成了與IBM、Oracle叫板的競爭力。這個競爭力主要三方面因素:1、成熟的框架平臺,可根據使用者角色,靈活配置各種“辦公桌面”,諸如:公司領導桌面、部門領導桌面、員工桌面等等。2、即插即用的協同元件,例如:單點入口、統一待辦、工作日程、常用功能、關鍵指標等等,這樣的元件有大約有四五十個吧,基於這些元件可以快速構建出不同角色使用者所需要的“辦公桌面“(也叫:個人工作臺)。3、價格低廉。(當然,除了這三點還有公司領導卓越的戰略定位和市場佈局)以上,讓我們在激烈的行業市場競爭中,終於殺出一條血路!以至於到後來的所向披靡,鮮有對手……轉眼,SOA時代就過去了,企業迎來了數字化時代。企業的資訊化也從系統建設、應用整合逐步轉向了資料管理、資料應用,企業門戶產品似乎也漸漸淡出了人們的視野。雖然企業門戶產品似乎退出了企業資訊化的歷史舞臺,但是門戶的理念卻一直沿用至今,例如我們經常看到的協同門戶、人力門戶、財務門戶、黨建門戶、生產門戶、銷售門戶等等,只要按照一定的業務邏輯把相關內容(資訊、連結、檔案等)聚合在一起,那它就是一個門戶。同樣,資料治理也需要這樣一個門戶,它可以根據使用者的角色將各類資訊和內容的彙集和整合,形成使用者專屬的“資料工作臺”,主要用於提供資料的訪問、查詢和分析,以及解決我們開篇提到的各類問題。根據不同的需求和功能,資料門戶也可以分為以下幾種型別:業務型資料門戶:主要面向企業的業務使用者,提供資料分析、查詢、報告和決策支援等功能。學術型資料門戶:主要面向學術機構和研究人員,提供科學研究資料的共享、查詢和分析等功能。社交型資料門戶:主要面向社會公眾,提供使用者生成的資料、社交資料和娛樂資料等,以及社交功能和使用者互動功能。行業型資料門戶:主要面向特定行業,如金融、醫療、教育等,提供行業資料的查詢、分析和應用等功能。政府公共資料門戶:主要面向政府機構和公眾使用者,提供政府公共資料的查詢、下載、分析和應用等功能。另外,按照所涉及的資料物件不同,我們經常將資料門戶又分為資料資源門戶和資料資產門戶。顧名思義,資料資源門戶是對資料資源的管理和彙集,而資料資產門戶是為資料資產的管理和查詢提供了統一入口。從功能上講,兩者並沒有什麼不同,但由於他們所涉及的資料物件不同,所以也會有一些區別,例如:資料資源門戶通常是由IT部門管理的,是對企業所有資料的匯聚和整合,而資料資產門戶則是針對那些對企業有價值的資料的整合,更多是為業務部門服務的,因為業務部門更清楚資料有哪些價值。資料門戶作為Portal的一個專項應用,其一些核心特性和理念,始終沒有改變,這些特性應該需要固化在企業的資料治理相關產品或系統中。遺憾的是,截至目前我還沒有在市面上看到過讓我眼前一亮的資料門戶產品。聚合是Portal的最基本能力,門戶不僅可以整合多種資料統計資訊,還可以實現各種資料管理和使用工具的整合,以及相關功能連結的匯聚,併為使用者提供統一的訪問和體驗。門戶為協同而生,沒有協同能力的門戶不是好Portal!資料門戶的協同能力表現在:1)可以支援團隊成員之間的協作和溝通,例如共享資料、討論、任務分配等。2)可以支援對相關資料進行評論、點贊、打分,增強使用者間的互動。3)可以支援快速發起一項資料標準或對某一資料進行質量檢核。資料如水,流動起來才更有活力,門戶的協同能力不僅能夠加速資料的流動,更能讓使用它的人進行互動,實現了資料價值的躍升!資料編織能力是指將來自不同資料來源的資料進行整合和處理的能力,是一種跨平臺的資料整合方式,它不僅可以集合所有業務使用者的資訊,還具有靈活且彈性的特點,使得人們可以隨時隨地使用任何資料。它可以將來自不同資料來源的資料進行拼接、清理、轉換和加工,以形成一致的資料檢視和資料集。藉助這個能力,企業可以快速構建起來自己的“邏輯資料湖”,即:資料在邏輯統一集中、物理不一定統一儲存。作為一種新興的資料管理和處理方法,資料編織多次被Gartner列為資料領域10大關鍵技術,它改進了資料倉儲和資料湖的概念,引入了一個新的架構(網路狀),透過知識圖譜及人工智慧演算法,實現資料資產的自動編目,可以將位於不同地方的資料,統一管理起來,使整個企業能夠統一利用資料。這是傳統“手工編目”所做不到的。資料編織之所以厲害,是因為他使用基於網路的架構而不是點對點的連線來處理資料,實現了從資料來源層面到分析、洞察力生成、協調和應用的一體化資料結構。10多年前,“主動推送”就是我們Portal產品的一個主要能力,但那時候的“主動推送”做的還比較笨重,只是透過需求調研將不同角色使用者所感興趣的資訊、待辦事項、通知訊息、統計資料、常用連結等相關資訊聚合在一起,形成一個特定的頁面,我們稱其為“辦公桌面”。儘管當時還遠遠做不到現在的所謂“千人千面”,但這種能力也可以幫助使用者更快地獲取到自己感興趣的資訊和他需要處理的事項,提升了使用者體驗。當然,現在的推薦演算法已經非常成熟了。首先,透過“OneID”實現使用者身份ID的統一;然後透過埋點技術可以收集大量的使用者行為和偏好資料;最後根據使用者的畫像和偏好模型,運用機器學習和推薦演算法,自動推薦相關的資訊和內容。資料門戶就可以利用這種能力更好的為使用者提供服務,改變傳統“人找資料”的模式,實現“資料找人”,提升使用者粘性和體驗。
看完了“資料門戶的特徵”這一部分內容,相信,你對資料門戶應該有一定了解和認知了,下面說一說該如何建設一個資料門戶。其實,根據Portal的技術發展,實際上應該有兩種建設方法:一種是上邊我們提到的新型資料門戶,一種我們姑且稱之為傳統資料門戶。實際上,實施一個資料門戶和做個資料資產管理專案或數倉專案從方法論上講沒有太大區別,基本上“三板斧”就搞定。首先是需求調研,透過對企業內部各部門的資料需求進行調研和分析,瞭解各部門的資料資產、資料訪問許可權、資料質量等情況,明確資料共享和使用需求。其次是資料盤點,採用“自上而下和自下而上”相結合的資料資產盤點方式,開展對各部門、各資訊系統資料的全面盤點,從而摸清楚企業各類資料資產的資料體量、儲存位置、歸口部門、主要作用等資訊。當然,在資料盤點過程中,還涉及資料的分類分級、資料資產的確權認責、資料的共享條件、資料的管理方式等等問題。這裡就不一一闡述了。有興趣可以看下之前我寫的這篇文章《企業資料資產到底怎麼盤?》根據資料盤點結果,完成資料資產概要資訊的登記,登記的內容主要包含三個方面的資料屬性資訊。第一,業務屬性,例如:資料資產名稱,所屬資料域,所屬資料分類、資料資產描述等;第二,技術屬性,資料資產位置(哪個系統,那張表),資料資產型別(結構化資料/非結構化資料),資料資產方式(資料庫/檔案/API介面)等;第三,管理屬性,資料資產所有者(歸口部門),資料資產管理員,資料資產上架時間,資料資產共享條件等。資料資產登記的過程,其實就是我們所說的資料編目,這個過程透過人工和自動化手段完成。依據筆者的觀察,目前國內市場的大部分資料管理系統的資料編目大多數還是手動編目的方式,而藉助AI演算法、機器學習、知識圖譜進行自動化編目的產品更多的還停留在概念或研製階段,只有個別產品用來輔助人工編目。資料目錄提供了資料訪問許可權管理和控制能力,確保資料的安全性和合規性,同時也要考慮資料的共享和開放,而資料門戶為資料的開放共享提供了“一扇窗”。資料共享:資料門戶提供了資料的查詢服務,可以根據“關鍵字”實現對相關資料的全文檢索;資料門戶提供了資料推薦能力,可根據使用者角色/崗位進行對相關資料資產進行推薦,以促進資料資產的共享和使用。資料應用:資料門戶聚合了各種資料查詢、探查、建模和分析的工具,以及這些功能的使用手冊、幫助說明以及實操影片,掌握工具的使用可以讓資料分析和應用事半功倍。資料門戶提供了對資料使用情況的統計分析,可以從組織、部門、使用者、資料分類等多個維度對資料的使用情況進行分析,支援企業設定資料使用情況統計指標,以推動資料的使用。新型資料門戶和傳統門戶的建設方法基本上沒有太大差別。新型資料門戶更多是將Portal技術和AI技術相結合,為使用者提供更加智慧的應用場景。例如:利用AI技術增強資料門戶的聚合能力,資料自動匯聚、自動編目,自動更新;利用AI技術增強資料門戶的協同能力,試想一下:如果我們的資料門戶中引入了ChatGPT-4會發生什麼?利用AI技術增強資料門戶的推薦能力,根據個人偏好主動推送相關資料,實現“千人千面”;利用AI技術增強對資料的管理和處理能力,讓更多的資料資源轉化的資料資產,讓資料門戶更有價值;利用AI技術增強對資料的挖掘和應用能力,為不同使用者直觀展示其關心的資料,實現資料驅動業務。可能有人會說,後邊的兩條是對資料本身能力的增強,而不是對資料門戶能力的增強。這其實並不衝突,我們透過門戶去共享資料資產、展示分析圖表、溝通資料問題,如果有資料不知道怎麼用或者資料質量有問題,挖掘不出資料的價值。那麼,資料門戶也就失去了它的意義了!
AI、門戶、治理是相互協同、互為補充的。透過治理提升了資料質量,AI的加持增強了分析和治理能力,然後在“門戶”中進行智慧化推薦、個性化展示、互動和協作,門戶為 “讓資料用起來” 提供了一個入口、一閃窗!AI之於資料,有太多的想象空間啦。未來會究竟發生什麼,我們不得而知,但一定可期!!!
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70024924/viewspace-2943764/,如需轉載,請註明出處,否則將追究法律責任。