一、資料脫敏技術——兼濟安全與價值
在大資料滲透至國家治理、企業執行、個人日常生活方方面面的當下,資料安全成為深受關注的另一個話題。根據安全公司Risk Based Security公佈的資料,2019年上半年發生資料洩露事件3800餘起,相比去年同期增加54%。安全研究中心Ponemon Institute和IBM Security聯合釋出的《2019年資料洩露成本報告》中指出,超過100萬條記錄的洩露預計會給企業帶來4200萬美元的損失。在這樣的背景下,資料洩露可能造成的潛在危害,驅使國家、行業、企業等各層面愈發重視資料安全問題。

2019年5月28日網信辦公開的《資料安全管理辦法(徵求意見稿)》中,明確要求對個人資訊的儲存和提供要經過匿名化處理,以切實降低個人資訊可能存在的洩露風險。而資料脫敏技術,是一種實現匿名化處理十分有效的方式。資料脫敏技術的主要目標是按照脫敏規則通過變形、轉換等方式降低資料的敏感程度,在資料的採集、傳輸、使用等環節中最小化敏感資料的暴露。在使用較為嚴格的脫敏規則時即可實現匿名化處理。

在降低資料敏感程度的基礎上,資料脫敏技術會最大程度上的保持脫敏後資料的可用性,使脫敏後的資料依舊能夠滿足關聯分析、機器學習、即時查詢等需求。根據應用場景和實現機制,資料脫敏技術可分為靜態資料脫敏和動態資料脫敏。

(一)靜態資料脫敏——大批量資料一次性脫敏處理
靜態資料脫敏旨在通過類似ETL技術的處理方式,按照脫敏規則一次性完成大批量資料的變形轉換處理。靜態脫敏通常會在將生產環境中的敏感資料交付至開發、測試或者外發環境時使用,在降低資料敏感程度的同時,能夠最大程度上保留原始資料集所具備的資料內在關聯性等可挖掘價值。
圖1  靜態資料脫敏
(二)動態資料脫敏——即席查詢結果實時脫敏返回
動態資料脫敏旨在通過類似網路代理的中介軟體技術,按照脫敏規則對於外部申請訪問的資料進行即時處理並返回脫敏後結果。動態脫敏通常會在資料對外提供查詢服務的場景中使用,在降低資料敏感程度的同時,最大程度上降低了需求方獲取脫敏後資料的延遲,請求實時產生的資料也能即時得到脫敏後結果。
圖2  動態資料脫敏
二、資料脫敏技術已深入眾多關鍵行業領域實用
對比Gartner於2018、2019年分別釋出的《資料脫敏市場指南》可以看出,企業對於資料脫敏或其他類似去識別技術的使用從2017年的15%增加到了2018年的20%,預計在2022年將達到50%。目前,資料脫敏技術在實際應用中,主要被用於保護個人隱私資料。因此廣泛的應用於政務、金融、電信、網際網路等大量儲存、使用個人資訊的行業領域中。

在政務領域,由於政務資訊來源於各政府部門的第一手資料,必然涉及到大量個人資訊。為保障政務平臺安全,嚴防敏感資料洩露,政務領域中資料脫敏技術被應用於敏感資料採集、傳輸、使用在內的全生命週期。

在金融、電信領域,廣泛存在著諸如交易記錄、通話記錄、賬戶資訊、手機號碼等個人敏感資訊,也存在著諸如徵信、反欺詐等需要使用個人敏感資訊的需求,同時還面臨著嚴格的監管要求。在此情況下,通過針對不同級別人員使用不同脫敏規則,以動態脫敏嚴格限制各級人員可以接觸到的敏感資訊,以靜態脫敏將生產資料交付至測試、開發等使用環節,成為當下金融、電信行業的首選。

在網際網路領域,越來越多的企業通過挖掘資料的額外價值實現業務收入提升。近年來頻發的資料洩露事件和針對網際網路企業使用使用者隱私資料的處罰不斷提醒著相關企業重視使用者敏感資料的保護。目前大型網際網路企業在使用使用者敏感資料進行使用者行為分析、個性化推薦、精準營銷等分析應用時,資料脫敏成為了必經步驟。

資料脫敏技術的供給側,主要包括三類企業。第一類是資訊保安服務商,這類企業從提供完整資料安全體系的角度出發,將資料脫敏作為其中關鍵一環提供給客戶,一般主要服務於金融、電信等行業;第二類是滿足自身需求的自研企業,主要包括運營商、通訊服務商、大型網際網路企業等,這類企業從自身資料脫敏需求出發,量身定製適合自己的資料脫敏工具;第三類是通用資料脫敏工具開發商,這類企業瞄準資料脫敏技術的應用前景,致力於開發出滿足市場需求的資料脫敏工具,產品可能會直接向企業出售,也可能同安全服務商合作,納入到資料安全解決方案中一同提供給客戶。

目前資料脫敏需求仍在增加,市面上的產品也層出不窮,但實際上供需雙方的對接並不順暢。企業出現資料脫敏需求時,需要考慮如何保證脫敏過程安全、脫敏程度是否達到要求等一系列問題,無法直接選取合適的產品,這實際上是由於時下資料脫敏市場缺乏針對產品本身的標準。一個符合規範標準的資料脫敏產品能夠打消需求方的眾多疑慮,因此資料脫敏工具的標準化以及評估評測工作十分值得關注。目前,中國信通院已聯合行業多家企業就通用資料脫敏工具制定了相應標準,後續也將陸續開展產品評測及其他相關標準制定工作。

三、資料脫敏技術四大發展趨勢
(一)資料脫敏效能持續提升
伴隨著資料量的與日俱增,資料實時性需求的愈加強烈,短時間內完成大量資料的脫敏處理將能夠進一步提升企業即時應用資料實現價值的能力。因此高效能資料脫敏將成為後續資料脫敏技術發展的一大方向。
(二)脫敏資料型別向非結構化發展
時下的資料脫敏技術主要面向結構化資料,對於非結構化資料的支援存在但相對較少。後續隨著人工智慧技術的發展,個人圖片、視訊、音訊等非結構化資料的儲存和使用將越來越多,因此相應的非結構化資料脫敏需求也將更加豐富,成為資料脫敏技術一大重點發展方向。
(三)智慧化資料脫敏技術成為趨勢
在資料量不斷增長的同時,被收集和利用的資料維度和種類也在不斷增多,需要使用者指定脫敏規則的執行方式將逐漸難以維繼。目前已有少量能夠自動識別敏感資料並匹配推薦脫敏演算法的資料脫敏工具,後續隨著機器學習技術的應用,集敏感資料自動化感知、脫敏規則自動匹配、脫敏處理自動完成等能力為一體的智慧資料脫敏技術將成為新趨勢。
(四)結合各級規範助力企業實現合規
資料脫敏在幫助企業減少敏感資料洩露潛在危害的同時,還可以確保企業對於個人資訊資料的使用合法合規。隨著國家和各行業對於資料安全立法的持續深入,企業在使用個人資訊時需要符合更多不同規範。因此後續資料脫敏技術與各級實際規範相結合,形成能夠直接幫助企業實現合規的資料脫敏工具將成為一大探索方向。

來自: 中國信通院