多地疫情再起,健康碼的“健康大考”如何過關?

Editor發表於2022-03-10

自疫情伊始,健康碼就成為了出行必需品。健康碼能保障疫情防控工作的高效開展,讓技術應用更好地為社會“加碼”護航。在關鍵時期,若健康碼出現訪問慢或者無法訪問,有可能影響整個城市的生產生活。在健康碼各項“健康”指標中,影響最大、最直接的是可用性在抗擊疫情的關鍵時刻,為保障健康碼的正常運作,發揮資訊化、大資料的賦能作用,安恆資訊特別推出重要民生系統安全保障服務,針對健康碼系統自身“健康”狀況進行檢查和維護


容量規劃與效能測試


安恆資訊為客戶現網進行把脈,首先根據當地人口規模等資料,評估出系統所需支援的最高併發連線、新建連線、併發請求等效能指標;其次是評估出現有系統所能達到的效能指標,幫助客戶發現現有系統的瓶頸,給出整改建議,讓系統能夠應對峰值流量。 容量規劃

這一步通常在系統建設之初就會設計,但是由於最初對高峰流量預測不準等問題,根據當前形勢,往往容量規劃需要根據人口重新分析。

容量規劃的目的在於讓每一個業務系統能夠清晰地知道,什麼時候應該加機器或者減機器,防疫健康碼場景需要準備多少機器才能在保障系統穩定性的同時節約成本。 路壓測

基於實際的生產業務場景和系統環境,模擬海量的使用者請求和資料,對整個業務鏈路進行各種場景的測試驗證,持續發現並進行瓶頸調優,保障系統穩定性的技術工程。


系統最佳化與持續監控


基於前一流程所得到的容量規劃和效能測試報告,首先是有針對性地進行系統最佳化與擴容,其次是對新的系統進行持續監控,確保第一時間發現問題,防患於未然。 系統最佳化與擴容

從整個系統的視角,縱觀整個鏈路,對防火牆、負載均衡、Web應用防火牆、源站等部件逐一進行最佳化或擴容。主要圍繞三個方面:消除單點、支援彈性伸縮與提前擴容。

消除單點單點故障是指系統中一但失效,就會讓整個系統無法運作的部件。比如,若整個系統中負載均衡裝置只有一臺,當負載均衡裝置出現故障時,則會導致系統出現無法使用的情況。同理,其他的系統部件,也可能會存在類似的單點風險。消除單點主要是透過主備自動切換、水平負載擴充套件等技術方案,來將原本由一臺裝置承擔的工作,交由多臺裝置負責,以此避免單臺裝置故障引起的全域性不可用問題。

支援彈性伸縮彈性伸縮能根據業務需求和策略自動調整計算能力。在業務需求增長時,彈性伸縮自動增加指定型別的例項,來保證計算能力;在業務需求下降時,彈性伸縮自動減少指定型別的例項,來節約成本。例如,當沒有疫情時,只需少量幾個虛擬機器即可滿足業務需求;當疫情爆發時,可透過虛擬化、容器化、自動編排等技術,自動擴容到原本的幾倍、幾十倍的計算能力,以此應對突然到來的流量。

提前擴容:是指根據目標容量峰值的科學預測和現有裝置實際的處理能力,提前進行裝置的採購、部署,提升現有裝置實際的處理能力,以應對未來的大流量威脅。持續監控

為確保系統的持續穩定執行,需要對系統進行實時的監控,一旦發現異常,需要透過告警來讓技術人員緊急介入。安恆資訊透過系統內部+外部雙重監控體系,來確保及時發現系統的風險。系統內部主要是對系統的各種元件進行多維度的監控,主要監控程式、日誌、網路、裝置資源等;系統外部主要是透過安恆資訊遍佈全國各地的監控節點,週期性、高頻率地探測系統是否可正常訪問。雙管齊下,可以保障技術人員隨時掌握系統的執行情況,及時進行應急處理故障或者突破閾值的情況。

 

專業運營團隊


健康碼類的重點民生系統所面對的內、外部情況都異常複雜,為徹底保障其“健康”地執行,除了要有好的軟/硬體,還需要由富有經驗的專業運維與應急團隊來保駕護航。

運營團隊組建模式以安恆資訊服務為例,安恆資訊保安產品支援三種交付和服務方式:

本地模式:採用本地安裝,結合本地駐場進行運維服務;

雲上雲下聯動模式:採用本地安裝,開通遠端通道,採用雲端運維服務。

雲端模式:將重要業務系統接入安恆資訊在本市的防護節點,有效解決訪問時延問題,並由雲端安全運營專家線上保障。

為減少生產環境故障的發生,在面臨裝置故障、網路故障、安全攻擊等突發事件可以快速發現、快速響應、快速處置、快速恢復,降低故障帶來的不良影響。安恆資訊基於重要系統保障經驗,沉澱了一套以人、流程和技術相結合的安全運營機制。透過主動的設計和配置、持續的系統狀態監測、檢測意外動作和非預期狀態去保護防禦下的業務系統,儘可能地降低不良影響造成的傷害。

安恆資訊具備大量應急保障經驗,積累了一套針對效能過載、負載均衡失效、系統遭受安全攻擊等突發問題的應急響應預案。在發生相關問題之後,及時通報給各部門進行響應,快速解決發生的問題,損失可降到最低。

雲端應急專傢俱備多地市健康碼系統的實戰保障經驗,分兩組人員進行7×24小時值守線上。


客戶案例——杭州健康碼


2020年,浙江省杭州市推出健康碼模式,安恆資訊緊急組建團隊投入到杭州健康碼專班工作中。透過本地防護裝置+雲端安全運營團隊,雲上雲下聯動的模式,安恆資訊為杭州健康碼的安全、穩定運營提供強有力的技術和人員支撐。為了應對不斷上升的併發需求與安全威脅,安恆資訊的安全運營團隊與健康碼建設專家聯合進行3次效能評估與測試,測試完成後進行相應的系統最佳化與擴容。由安恆資訊保安運營團隊進行7x24小時安全值守,結合雲端專家及聯動雲端威脅情報,持續對安全規則進行調優,實現全面精準攔截惡意攻擊行為,實現從網路層、應用層、資料層等多層面安全防護。

2022年春節前夕,杭州突發新冠疫情,從1月27日凌晨開始,安恆資訊駐杭州健康碼專班接到了杭州市疫情防控指揮部的緊急需求,在賦碼新規調整的72小時內,配合市資料資源管理局開展核酸檢測報告讀取和健康碼自身效能壓力測試,推進各節點擴容。在48小時內有效地將健康碼效能從3000QPS提升至常駐人口的千分之一10000QPS, 進一步簡化市民讀取核酸報告的後臺鏈路,在省一體化智慧化公共資料平臺支援下,保證了健康碼的穩定性與相容性。


多地疫情再起,健康碼的“健康大考”如何過關?


本著務實與探索的精神,安恆資訊透過資訊化手段,結合技術與運營優勢,全方位守護健康碼安全,助力疫情防控工作高效有序進行。

相關文章