大資料行業近年迎來多項重大變化,一方面資料要素化再次強調資料戰略地位,另一方面《資料安全法》《個人資訊保護法》等法律法規標準進一步明晰行業規範,同時資料技術創新與應用創新也在快速演進。

由中國資訊通訊研究院、中國通訊標準化協會指導,中國通訊標準化協會大資料技術標準推進委員會主辦的“2022大資料產業峰會近日在京舉辦。會上,中國信通院雲大所所長何寶巨集釋出「2022大資料十大關鍵詞」,對大資料行業的最新發展趨勢進行了總結與分析。

關鍵詞一:創新型資料庫優化資料資源化過程

資料庫作為支撐資料儲存、計算的核心技術產品,為了適應資料要素相關需求,正快速進行技術革新。

一方面,AI資料庫、Serverless雲原生資料庫推動對於資料的價值挖掘從陽春白雪變為下里巴人利用資料不再是金融、電信等資料密集型行業的特色,而是變成全社會、全行業的普適性行為。這導致資料的加工利用過程需要更加平民化、高效化。

AI資料庫具備自動運維、智慧開發等能力,Serverless雲原生資料庫具備按量計費、彈性擴容等能力,均可實現資料加工利用過程的降本增效。

另一方面防篡改資料庫、全密態資料庫支撐資料完成高效確權定價、便捷合規流通。防篡改資料庫在高效儲存計算基礎上,提供資料防篡改和操作防篡改功能,從而支撐資料確權定價,而全密態資料庫能夠實現資料在加密狀態下的高效儲存和計算,從而支撐資料合規流通。兩者均成為學術機構和供應商的研究熱點。

關鍵詞二:圖計算平臺助力大規模圖資料資源化

圖資料與傳統行列式資料不同,它通過點、邊模型,高效描述實體、屬性、關係的資料模型,近年來被廣泛用於企業智慧營銷風控等必要資料應用中。

隨著行業資料智慧轉型的深入,圖資料在資料總量中的比例也正在快速上升。Gartner預計,到2025年圖技術在資料和分析創新中的佔比將從2021年的10%上升到80%

隨著圖資料規模的變大,開啟了圖資料的大資料時代,起源於80年代的傳統關係型資料庫,以及起源於2000年左右的專用圖資料庫已經無法支撐大規模圖資料的高效儲存與計算。

圖計算平臺通過抽象計算層和整合層,在圖資料庫基礎上增強了相容性和大規模資料計算能力,實現了多種儲存介質中圖資料的高效匯聚以及多跳情況下的複雜計算能力。

目前該領域政策扶持力度不斷加大,開源體系發展迅猛,商用產品層出不窮,從而快速支撐了圖資料這一重要要素型別的價值釋放。

關鍵詞三:資料中臺成為企業挖掘資料要素價值的核心引擎

隨著企業數字化轉型的加深,資料相關係統、組織逐漸複雜、冗餘,壁壘逐漸增多。

為在組織或企業內部構建一套可複用的資料和分析能力,減少資料本身及相關技術架構的冗餘,打通不同系統資料間的壁壘,資料中臺應運而生。

其理論體系從發展初期的百家爭鳴,逐漸聚焦和明確,並在業內達成共識,即資料中臺構建了資料資源與業務價值間的骨幹網,是企業數智化轉型的核心引擎

近年來,由於數字化轉型政策的持續推動,資料中臺發展迅猛,Gartner在成熟度曲線中將其標記為期望值最高。國內該領域供給側迅速發展、供應商不斷豐富,應用側相關落地案例迅速增多。

關鍵詞四:DCMM貫標引領行業資料治理

DCMM是我國資料管理領域的首個國家標準,為企業資料管理工作提供客觀的評價依據,指導企業體系化構建資料管理框架、持續優化資料管理能力。

經過近3年時間的發展,DCMM已得到廣泛認可,貫標評估的工作成效正加速顯現。在資料要素統一大市場的培育過程中,DCMM貫標評估可以提升各類市場主體的資料能力和資料活力,彌合地區間差異、拉齊行業間水平,擴大資料資源優質供給,從而提高資料要素流通效率,引導資料資源的高效積累和有序聚集。

為持續推動企業資料管理能力提高,工信部印發企業資料管理國家標準貫標工作方案,全國各地配套產業補貼政策,推動重點地區、重點行業的貫標評估工作,預計到2025年,貫標評估企業超1萬家,宣貫培訓人員超15萬人。

關鍵詞五:資料估值成為資料資產化切入點

資料估值探索歷程伴隨著企業數字化轉型的發展而發展。

Gartner2015年提出資訊價值評價框架,從資訊內在價值、資訊商業價值、資訊績效價值、資訊成本價值、資訊市場價值、資訊經濟價值六大維度進行衡量。但是,這一框架多停留在理念層面,僅明確了主要影響因子,未提出具體的測算指標和方法。

中國企業的全面數字化轉型大致始於2015年,並在2017年後進入爆發期。企業在意識到資料價值的同時,投入了巨大的人力、物力和財力,因此,亟需一套估值指標清晰量化資料價值,評價數字化轉型的成效。

2021年初起,部分企業陸續進行資料估值的研究與實踐。但是我們也應認識到資料估值仍處於發展初期,估值目的、估值框架有待在具體場景中探索驗證。

我們在分析業界資料估值的成果後,認為可以將資料產品作為估值物件,而估值實際上是在衡量資料對於業務發展貢獻的間接經濟價值,以及將資料視為商品進行交易獲得的直接經濟收益,因此,資料估值是一項涵蓋了資料管理、資料應用、資料交易、AI建模的綜合性工作。

關鍵詞六:DataOps定義資料開發應用新模式

DataOps的概念最早在2014年由國外學者提出,隨後業界逐步對其內涵進行補充。其在2018年正式被納入Gartner的資料管理技術成熟度曲線當中,由此進入了國際的視野當中。

2022年中國信通院正式牽頭啟動了DataOps的標準建設工作,以此為基礎推動我國大資料產業的多元化發展。DataOps作為協助企業完成數智化轉型的良藥,供給側和需求側都在爭相嚐鮮。不少廠商、企業紛紛採納DataOps的理念構建新一代資料研發工具平臺並進行實踐,都取得了不小的成果。

在標準化方面,今年信通院牽頭聯合各行業30餘家單位開展標準制定工作。標準包括了7個模組25個環節,旨在推動我國資料文化紮實發展。

關鍵詞七:隱私計算一體機助力資料要素流通破局

今年是隱私計算落地應用元年,多個場景應用加速落地,隱私計算一體機為應用開闢新路徑。

一是作為軟硬結合一體的專用裝置,利用硬體特性增強軟體實現方案,其安全加固、效能加速和易用性增強的三大優勢,使得隱私計算一體機從眾多工程優化方案中脫穎而出,降低使用者使用技術門檻和綜合成本。

二是一體機的技術實現方式不唯一,各家產品百花齊放。可基於可信硬體或加密卡,同時利用計算加速卡或網路加速卡,也可預裝應用服務場景元件,組合方案多樣化。多硬體多角度組合提升成為軟硬結合發展趨勢,並在金融政務醫療等場景嶄露頭角。

三是產品形態多樣,標準化需求迫切,國內外已有多個標準帶頭規範技術研發和應用。但也值得注意,並非僅有隱私計算一體機可以突破應用瓶頸,擴大應用規模,面對資料安全流通巨大的需求,我們仍要繼續探索更多好用易用的落地方案。

關鍵詞八:資料要素政策從巨集觀到落地

今年年初,十四五數字經濟規劃、要素市場化配置改革方案兩份檔案對資料要素的專門佈局,讓資料要素領域的探索再掀熱潮,政策推進、產業實踐都在不斷深入、不斷創新。

一是頂層設計逐步細化,國家站在全國統一大市場的高度對資料要素髮展做出安排,又針對深圳示範區的資料要素市場準入做出具體部署,資料基礎制度體系建設也在加快推進。

二是地方法規陸續出臺,目前已有十九省市公佈了相關資料條例,以促進資料利用和產業發展為基本定位,多以公共資料為抓手,結合地方實際和特色進一步激發市場主體活力。

三是交易模式不斷創新,各地資料交易所優化經營結構,貴陽制定交易規則、上海建設數商體系、深圳打造開源社群等探索讓資料交易有了更實在的依託。

但是我們離資料要素價值的充分釋放還很遠,資料權屬、定價的共識還未建立,資料洩露、越權濫用等問題加劇人們的不信任感,如何建立有效的規則體系和監管機制,如何利用前沿技術破解難題,仍需政產學研用各界共同發力。

關鍵詞九:資料安全合規整體邁入新階段

隨著2021年兩法的頒佈實施,各行各業的資料安全監管力度不斷加強,合規工作也邁入新的階段。

首先,為了正確理解監管內容,有效落實監管要求,各行各業廣泛掀起了政策法規的學習浪潮。

其次,資料分類分級作為資料安全領域的重要工作,也是實現精細化安全管理的必要能力,同樣成為這一輪學習熱潮的重點關注物件。

再次,為推動本行業企業資料安全的貫徹落實,部分行業主管單位啟動監管報送工作。最後,在供應側市場,部分企業開始著手開發合規管理工具,以協助需求方實現監管應對的自動化實現。

關鍵詞十:資料分類分級在資料安全治理中率先落地

資料分類分級作為資料安全工作的基礎內容,是資料安全精細化管理的必要前提,需要在資料安全治理工程中率先落地。憑藉在方法論共識、行業細化、工具開發等方面呈現的發展態勢,資料分類分級同樣上榜十大關鍵詞。

首先,分類分級作為《資料安全法》明確提到的概念之一,引起地方、行業、企業的研究探討,並逐漸形成從建立組織保障到落實對應級別資料安全管控策略的七步走方法論共識。

其次,為指導企業分類分級工作的推進落實,各行業通過制定標準規範,明確分類分級工作的原則、方法、定義,進一步細化相關要求。

最後,自動化分類分級工具或諮詢服務在資料安全供方市場蓬勃發展。據中國信通院可信數安評估體系統計,2022年分類分級工具或服務的參評企業從2021年的4項增加至14項。

十大關鍵詞總結

2022大資料領域十個關鍵詞涵蓋政策、理念、安全、技術等支撐資料要素價值釋放的方方面面,這些關鍵詞所涉內容的快速發展,進一步印證了我國資料要素市場在快速發展過程中,已逐步構建起政策引領、理念先行、技術支撐、安全護航的健康發展格局。

本文轉載自:大資料技術標準推進委員會