如何築造資料安全邊界

华为云开发者联盟發表於2024-01-31

本文分享自華為雲社群《【雲享問答】第6期:如何築造資料安全邊界?》,作者: 華為雲社群精選。

當前AI技術的快速發展,大模型、大資料正在加速對海量多樣化資料的應用。資料已經成為核心資產,而資料安全和隱私保護的重要性也日益凸顯。資料脫敏作為資料安全管控體系的關鍵環節,能夠有效地保護敏感資料的安全。為了滿足開發者對於資料脫敏的需求,GaussDB(DWS) 動態脫敏功能應運而生。本期【雲享問答】透過這10個問題,帶你全方位瞭解GaussDB(DWS) 動態脫敏功能及效果。

1 什麼是資料脫敏?

資料脫敏是透過遮蔽敏感資料來保護資料安全的一種方法。它可以將敏感資料變形,例如身份證號、手機號、客戶姓名、郵箱地址等。資料脫敏分為靜態資料脫敏和動態資料脫敏兩種。

GaussDB(DWS)提供列級別的資料脫敏(Dynamic Data Masking)功能,GaussDB (DWS)資料脫敏功能,基於SQL引擎既有的實現框架,在受限使用者執行查詢語句過程中,實現外部不感知的實時脫敏處理。

2 資料脫敏能解決什麼問題?

資料脫敏能力對於使用者具有多重重要價值。它不僅能夠消除暴露個人敏感資料的風險,確保個人隱私安全,還能助力企業遵守CPRA、GDPR、HIPAA等隱私法規,避免因違規而引發的法律風險。同時,資料脫敏技術在處理資料時能夠保持資料的一致性和可用性,確保脫敏後的資料依然能夠支援業務運營和決策分析。此外,透過脫敏處理,還可以降低資料在高效共享過程中的風險,防止敏感資訊被惡意利用,從而保護企業免受網路攻擊和資料洩露的威脅。

3 脫敏策略是什麼?

脫敏策略(Redaction Policy)在資料安全管理中扮演著至關重要的角色。脫敏策略是與資料庫中表物件是一一對應的。一個完整的脫敏策略通常由三個關鍵部分組成:表物件、生效條件以及脫敏列與脫敏函式的對應關係。

表物件指定了策略應用的資料庫表。生效條件則是一個布林表示式,它決定了何時應用脫敏規則。脫敏列與脫敏函式的對應是脫敏策略的核心。不同的欄位根據其儲存資料的特性和敏感性可以採用不同的脫敏函式。

當且僅當生效條件為真時,查詢語句才會觸發敏感資料的脫敏,而脫敏過程是內建在SQL引擎內部實現的,對生成環境使用者是透明不可見的,既保障了資料安全,又不干擾使用者的資料訪問。

如何築造資料安全邊界

4 在實際開發過程中,資料脫敏怎麼用?

以DWS為例,在建立脫敏策略時,需要先確定受限制的使用者角色,識別和梳理具體業務場景的敏感欄位,然後確定脫敏列需要繫結的脫敏函式,最後構造策略建立的語句並執行,從而預製好脫敏策略。

如何築造資料安全邊界

常見的使用函式語句實現脫敏效果

5 資料脫敏應用過程中,如何做到資料庫內可算僅庫外不可見?

資料庫內要求原始的敏感資料能夠參與加工計算,僅在出庫的時刻敏感資料才會被脫敏處理。例如投影列表示式、投影列函式、聚集函式、過濾條件、分組條件、子查詢位置投影列表示式等,需要原敏感資料直接參與加工計算。在表查詢、檢視查詢、COPY查詢、GDS外表匯出等場景觸發時會進行資料脫敏。可算不可見功能有一個前置的條件,需要開啟開關enable_redactcol_computable=on!。

6 GaussDB(DWS)的動態脫敏功能是如何進行資料保護的?

GaussDB(DWS)的動態脫敏引擎與底層系統緊密配合,高效、安全、可靠地處理資料。其直觀的DDL語法介面,使使用者能輕鬆配置、調整脫敏策略,靈活應對不同場景。系統不僅內建多種常見脫敏方法,還支援使用者自定義脫敏函式,滿足個性化需求。在保障資料安全的基礎上,該引擎確保脫敏資料的高可用性,維持業務價值。同時,透過嚴格的許可權和訪問控制,僅授權使用者可訪問敏感資料,全面守護資料的安全與隱私。

第三方脫敏工具多為外掛式,僅支援靜態脫敏,無法實現實時動態處理。相比之下,GaussDB(DWS)的內建脫敏功能更加透明、高效。

7 在GaussDB(DWS)中,如何快速配置和使用動態脫敏功能,並支援非固定格式的資料脫敏?

GaussDB(DWS)提供DDL語法支援使用者快速配置脫敏策略,使用無特殊要求,原SELECT語句即可觸發。GaussDB(DWS)對於常規資料型別均支援,且提供使用者自定義脫敏函式,可以對更多場景支援更靈活脫敏效果。

8 GaussDB(DWS)是否支援跨資料表傳遞脫敏資料,傳遞過程中是否繼承原脫敏策略?

在GaussDB(DWS)的庫內可算庫外不可見場景下,由於參與資料運算的是原始資料,故DML語句執行過程,寫入/更新目標表都是原始資料去更新的,故需要引入脫敏策略繼承機制,分析語句中子查詢的脫敏資訊,並繼承到目標表中,此場景即涉及脫敏策略的繼承。

9 在應用GaussDB(DWS)過程中,如何保證資料脫敏的實時性?

為了確保實時性,GaussDB(DWS)採用動態資料脫敏方式。動態資料脫敏,是指資料查詢過程邊輸出邊脫敏,策略定製的脫敏函式發生變化,查詢的脫敏效果也實時更新。

這就意味著DWS在資料查詢過程中,資料會邊輸出邊脫敏。這種並行互動的方式最大限度地減少了效能損失,使得實時性得以保證。根據提供的資訊,效能劣化在10%以內是可以接受的。因此,各種場景下的實時性需求都能得到滿足。

10 針對不同的使用者或角色,GaussDB(DWS)能否有不同的脫敏策略?

GaussDB(DWS)資料脫敏含有三要素:脫敏策略應用的表物件、脫敏欄位-脫敏函式對、脫敏生效條件,此三部分資訊透過REDACTION POLICY語法承載。WHEN表示式子句可以傳遞生效條件,針對不同的使用者或角色去判斷。

更多關於GaussDB(DWS)產品技術解析、數倉產品新特性的介紹,請關注GaussDB(DWS)論壇,技術博文分享、直播安排將第一時間釋出在GaussDB(DWS)論壇

點選關注,第一時間瞭解華為雲新鮮技術~

相關文章