好大夫資料安全分類分級實踐探索

ITPUB社群發表於2022-11-28

一、摘要


隨著《資料安全法》和《個人資訊保護法》在2021年的相繼出臺並施行,整個社會對個人資訊保護與資料安全的重視程度達到了前所未有的高度。好大夫線上收錄了國內正規醫院的90多萬名醫生資訊(其中25萬名醫生實名註冊),已向全國8000萬患者提供了線上醫療服務,累積了大量的健康資訊、病情描述和病歷處方等醫療健康資料。持續為使用者提供安全、穩定的醫療服務,保護醫生和患者的資料安全,是好大夫線上對所有使用者的承諾。資料分類分級是資料安全治理的一項基礎性工作,是實現有效資料安全管理的底座。如何有效開展資料分類分級工作是網際網路醫療企業需要直面的一道必答題,本文將好大夫開展資料分類分級工作的實踐經驗進行總結,希望對此領域感興趣的同學能夠起到一定借鑑作用。

1.1 資料分類分級價值

滿足安全合規要求:《資料安全法》中明確提出建立資料分類分級保護制度,制定重要資料目錄,加強對重要資料的保護。《個人資訊保護法》中規定個人資訊處理者應當對個人資訊實行分類管理。各類行業監管相關要求也都對資料分類分級提出明確要求,開展資料分類分級工作已成為當前安全合規工作中的一項緊急任務,需要採用管理和技術手段落實資料分類分級工作。

降低業務安全風險:透過對資料的分類分級,識別出組織內重要敏感資料,掌握組織敏感資料資產分類、分級、分佈情況及各類資料的使用場景,從而制定有效的防護措施,平衡資料流動創造價值與資料安全的矛盾,降低企業開展業務的安全風險。資料分類分級工作開展過程能夠對資料資產實現精細化管控,透過監控審計策略,有效監控敏感資料的動態流向,使資料使用、資料共享行為“可見可控”。

滿足自身業務需求:資料分類分級形成資料資產清單是資料治理的基礎,梳理清楚資料資產、敏感資料類別、安全級別、賬號許可權等資訊,能夠幫助業務部門在涉及資料處理活動業務場景制定更為合理的策略,提升業務運營能力,為組織提供精準的資料服務,促使組織業務良性持續發展。

1.2 資料分類分級思路

經過一段時間的資料分類分級工作實踐,我們覆盤總結出了好大夫資料分類分級思路框架(分別從管理制度、技術工具和運營流程等3方面進行系統性建設),之後將工作成果應用於資料共享和使用等各類資料處理活動。

好大夫資料安全分類分級實踐探索


二、資料分類分級制度建設


資料分類分級制度建設是對資料分類分級工作機制的確認和劃分規則的明確,如果是金融行業的企業這部分工作相對輕鬆,中國人民銀行印發的《JRT 0197-2020金融資料安全 資料安全分級指南》中給出了金融行業典型資料型別及建議劃分的最低安全級別,這種分類分級規則金融行業企業拿來直接使用即可,節省了分類分級規則制定和內部溝通解釋的成本。醫療健康行業沒有明確的資料分類分級行業標準和指南,我們可以參考《GB_T 39725-2020 資訊保安技術 健康醫療資料安全指南》中的資料分類分級相關規則,再結合網際網路企業自身特點和業務場景制定《資料安全分類分級制度》。制度中明確了資料分類、資料分級的規則和示例,以及資料在各類資料處理活動過程中的規範和要求。

2.1 資料分類

資料分類是根據組織資料的型別、特徵、規模、屬性,將其梳理、歸類和細分,以便更好地管理和使用組織資料的過程。我司依據GB_T 39725-2020 《資訊保安技術 健康醫療資料安全指南》,結合網際網路醫療現有業務場景,將敏感資料欄位分為個人屬性資料、身份鑑權資料、健康相關資料、醫療應用資料、醫療支付資料和其他6類,具體參見表1《好大夫線上資料分類分級規則》。

2.2 資料分級

資料分類後組織要對資料進行定級,按照資料遭到破壞後對各類合法權益的危害程度,對資料進行定級,從而為組織資料資料全生命週期安全管理制定提供支撐的過程。我們參考了GB_T 39725-2020 《資訊保安技術 健康醫療資料安全指南》,結合網際網路醫療現有業務場景,將敏感資料欄位分為4個級別,具體參見表1《好大夫線上資料分類分級規則》。

好大夫資料安全分類分級實踐探索

表 1 好大夫線上資料分類分級規則


三、資料分類分級工具建設


3.1 資料資產管理平臺

資料資產管理平臺我們是在資料庫自動化管理平臺基礎上進行開發的,考慮到資料資產清單要與資料庫表結構高度關聯,同時結合好大夫SDL安全評估流程,需要關聯到業務系統。主要功能包含資料分類分級清單、資料安全運營工單流程、第三方資料安全管理模組、敏感資料匯出檢視管理模組。

3.2 敏感資料識別工具

對結構化資料掃描識別敏感資料,我們使用了開源軟體D18N,D18N是一款強大的資料脫敏和敏感資料識別工具,支援關鍵字匹配和正則匹配兩種關係型資料庫敏感資料識別演算法。我們的資料資產管理平臺與D18N工作做了整合,增加了建立控制掃描任務、掃描結果自動比對、掃描結果人工確認等功能。工具內部提供了敏感資料識別通用規則,我們結合網際網路醫療業務場景參照模板對規則進行了自定義,完善了關鍵字匹配規則,透過正規表示式補充了病例資料URL型別資料識別規則,圖1為D18N識別引擎部分自定義規則。

好大夫資料安全分類分級實踐探索

圖 1 敏感資料檢測工具規則

3.3 資料安全監控大盤

資料分類分級的結果呈現和資料使用情況監控需要一款強大的監控視覺化平臺,對資料資源清單敏感資料進行展示、資料分佈情況、資料使用情況進行監控展示,好大夫技術團隊使用了grafana,其提供了多種方式建立、共享、瀏覽資料。grafana支援多種資料來源型別的對接,我們在做資料安全治理過程中對接了資料資產管理平臺MySQL資料庫、ClickHouse、Elasticsearch三個系統的資料來源,可以獲取需要展示和監控的各類動靜態資料。圖2為監控盤中資料分類分級情況部分,展示資料資產清單中有哪些敏感資料型別、敏感資料欄位分佈、資料分級情況,第三方使用敏感資料情況等。

好大夫資料安全分類分級實踐探索

圖 2 資料安全監控大盤


四、資料分類分級流程建設


4.1 入庫階段資料分類分級

為了解決新增業務專案涉及敏感資料欄位的識別標識問題,我們將資料分類分級與資料庫建表工單打通整合,業務開發人員在申請MySql建表工單時要先自評估新增表欄位是否涉及敏感資料,如涉及需要在工單中對資料進行分類和分級打標,此工單會經過安全和DBA進行二次複核,無問題後會將結果同步到資料資產清單中。同時,安全人員結合敏感資料情況以及工單中專案編號對應的業務需求進行安全評估。

好大夫資料安全分類分級實踐探索

圖 3 資料庫建表過程資料分類分級流程


下圖為資料庫建表工單中資料分類分級樣例:

好大夫資料安全分類分級實踐探索

圖 4 資料庫建表工單資料分類分級


4.2 存量資料的分類分級

對於存量資料和入庫階段遺漏的敏感資料要定期使用敏感資料識別工具執行檢測任務,為了避免對線上資料庫效能影響,我們掃描物件為線上備份資料庫。檢測工具會根據預定義好的敏感資料規則清單進行檢測識別,檢測出的結果對接到安全管理平臺上與之前梳理好的敏感資料清單中敏感欄位做比對,去掉重複欄位,新增加的敏感欄位由安全人員確認類別和級別同步到敏感資料清單中。因資料資產清單變更需要將清單配置同步至其他管理系統中,如:脫敏系統、加密系統。資料分級動態運營過程需要長期持續進行,最佳化流程調整規則,結果趨勢是工具檢測的敏感資料越來越少。

好大夫資料安全分類分級實踐探索

圖 5 存量資料掃描分類分級流程


下圖為存量資料掃描結果列表:

好大夫資料安全分類分級實踐探索

圖 6 存量資料掃描結果


4.3 資料分類分級的其他流程

在資料安全治理工作中涉及資料分類分級的其他工作流程有很多,在上一篇《好大夫合作方資料安全閉環管理實踐》文章中合作方介面對接的敏感資料欄位(庫-表-欄位)需要與資料分類分級對接整合。資料分類分級理念和流程會滲透到各項資料處理活動中,需要不斷完整,以下舉幾個常見的應用場景:

  • 資料分類分級規則變更:由於監管環境變化、業務場景調整等因素,會涉及資料欄位分類和級別的變更,這類變更可以由業務發起由安全人員稽核確認,也可以由安全人員發起;

  • 大資料敏感資料使用:通常4級資料欄位不允許大資料叢集處理,3級資料欄位受限處理。大資料叢集對於3級敏感資料明文處理需要進行授權審批,需要依據資料應用場景、資料屬性進行綜合評估;

  • 敏感資料匯出檢視:日常業務運營遇到特殊情況和場景會涉及到4級敏感資料匯出和檢視,這種行為需要嚴格的授權稽核,稽核過程需要關注申請原因、資料量級。


五、資料分類分級結果呈現


5.1 資料資產清單

資料資產清單是資料分類分級工作的核心產出物,可幫助組織摸清資料資產家底。我司在資料安全管理平臺中對資料欄位進行打標,展示每個欄位歸屬的分類、所屬的安全級別。梳理的資料資產清單展示庫、表、欄位、所屬系統、型別、級別、大資料消費情況、SQL查詢是否脫敏等情況。

好大夫資料安全分類分級實踐探索

圖 7 資料資產清單

5.2 資料資產分佈圖

資料資產分佈圖和資料安全監控大盤是資料安全治理的重要抓手,我司資料監控盤分為資料資產分佈圖、第三方資料使用監控盤和敏感資料使用監控盤。資料資產分佈圖包含敏感資料分佈圖和合作方消費資料分佈圖。圖8為敏感資料分佈圖透過圖能夠展示敏感資料的靜態分佈,各個應用系統具體涉及到哪些敏感資料,敏感資料的庫、表、欄位及級別。

好大夫資料安全分類分級實踐探索

圖 8 敏感資料分佈圖

圖9為合作方資料分佈圖主要程式合作方消費使用好大夫敏感資料情況,圖中具體展示了合作方、敏感欄位、敏感資料級別情況,完整描繪敏感資料在業務合作場景中流轉和分佈。

好大夫資料安全分類分級實踐探索

圖 9 合作方資料分佈圖


六、資料分類分級工作展望


6.1 醫療應用資料的識別

醫療應用資料型別十分複雜包含文字、圖片、影片、語音等,結構化文字資料型別如病情描述資訊、醫患交流資訊在組織內分佈廣泛,很難透過關鍵字和正規表示式有效地識別。利用圖形識別和自然語言處理等技術應用於資料分類分級可能會是醫療健康行業資料分類分級的解決之道。

6.2 資料血緣關係的建立

目前資料分類分級地圖為靜態資料分佈,沒有展示資料流轉路徑和資料透過個子系統之間的關係。資料血緣關係能夠展示資料欄位的生命週期及邏輯關係,使安全人員更加深入瞭解資料如何使用消費、使用使用者情況,進而更加精準設定訪問控制許可權、脫敏加密規則。

6.3 資料分類分級的應用

資料分類分級是資料安全治理工作的基礎,完成資料分類分級在資料處理活動安全治理過程的應用更是任重道遠,要結合業務場景持續開展落地資料分類分級成果和理念。資料分類分級需要與常見的資料安全技術(DLP、資料脫敏、資料加密、訪問控制、監控審計等)合理結合使用才能掌握業務發展與安全風險控制的平衡點。


七、結束語


開展資料分類分級過程中積累了一些心得體會,組織內在開展資料分類分級工作前需要對業務發展方向、業務應用場景、資料使用場景充分調研,進而抽象出業務規則場景、資料資產特點,便於制定資料分類分級制度規則。資料分類分級工作流程要與現有資料工作流程相結合,落地實現方案需要與各業務部門、運維團隊、大資料團隊以共創的方式進行充分溝通。資料分類分級工作需要全員廣泛參與,資料分類分級制度規則的大量宣貫工作尤為重要,引導大家學習制度、遵守規則、完善流程。最後感謝全體參與資料分類分級建設工作過程中各位同事,是你們築起好大夫資料安全之盾。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70024420/viewspace-2925496/,如需轉載,請註明出處,否則將追究法律責任。

相關文章