睿象雲案例|智慧一體化告警管理持續賦能曠視科技雲端業務發展

ruixiangyun發表於2020-11-06

北京曠視科技有限公司 (以下簡稱:“曠視科技”) 是一家行業領先的人工智慧公司 在深度學習方面擁有核心競爭力。曠視 科技 向客戶提供包括先進演算法、平臺軟體、應用軟體及內嵌人工智慧功能的物聯網裝置的全棧式解決方案,並在金融科技公司、銀行、智慧手機公司、第三方系統整合商、物業管理者、學校、物流 多個行業 佔據行業領 先地位。

 

近年來曠視 科技 各項業務快速發展, 個人物聯網、城市物聯網 供應鏈物聯網 三大場景 均有佈局 並擁有 雲服務和開發者、消費電子、城市管理、園區、物流及零售 行業的核心領域業務。作為國內計算機視覺領域的“獨角獸”,已經 連結及賦能百億物聯網裝置的人工智慧基礎設施 。而作為曠視科技的主流業務“基於雲端的人臉識別解決方案”更是積累了大量資料,而越來越多的實時線上影像比對給整體的 I T 系統的穩定執行帶來了巨大挑戰, 構建安全、穩定、有序、高效的IT運維管理模式, 成為 推動業務系統穩定執行 增強自身競爭能力的關鍵一環

 

打造資料新基建 實現一體化、體系化、視覺化

保障業務的穩定執行 曠視科技採用了 Zabbix  Prometheus grafana 與眾多基礎資源監控系統來監控系統執行。系統之間彼此相連, 任何一部分效率降低或者故障,都將降低IT服務的可用性,輕則造成資訊訪問延遲,重則帶來各種不可預估的業務中斷。   一體化集 中監控”是 實現系統高可用行的基礎。

 

為此, 曠視科技 選擇部署 睿象雲的 智慧告警 平臺   Cloud Alert (以下簡稱:C A ), 系統中的所有監控工具進行統一的整合管理的同時,可直接對各 類告警資訊 進行統一的管理並 透過CA 平臺的智慧演算法 實現 同時透過分派、排班、通知等功能,快速實現 跨平臺 告警 的一體化 流程化管理,提升告警管理能力。

曠視科技透過睿象雲 基於IT 運維行業的海量告警資料,自研 開箱即用的演算法, 實現 更加精準的文字聚合能力。 在告警生成的過程中 實時抑制告警風暴,極大的降低告警通知的數量 ;在告警的事後回溯中, 根據告警內容自動進行分類、聚類,幫助運維人員大幅降低告警分析的資料量,從而縮短故障恢復時間。

 

管理方 透過   CA 平臺提供 多維度報表 ,隨時掌握系統執行狀態、 告警 狀況分析和 成員工作效率,概覽系統執行狀況。資料包表的視覺化展現,也方便了日常資料彙報、跨部門溝通等工作

 

多渠道通知必達, 做到“業務有數,心中有路”

告警是IT運維中不可或缺的環節,徒有強大的監控機制而告警 通知 機制跟不上,不能在緊急情況下把 告警 資訊及時傳遞給運維人員,那麼IT監控形同虛設。 所以睿象雲 CA 平臺的自 告警 通知機制,真正的幫助曠視科技的運維小夥伴們實現通知必達, 提高 系統執行保障能力。

 

透過 CA 平臺可以按照不同類別的 告警 進行自定義的 分派 策略 保證了 業務問題能夠實時地傳送給 相關的團隊和負責人。並可透過 排班 功能 規則可以滿足團隊成員在全時段處理告警的分工需求 ,即使由於值班人員的疏忽沒有接到告警通知,也可以自動升級給團隊中的其他人員。真正做到了每一條告警都不遺漏,並 完美 地體現了 曠視 科技更人性化的工作氛圍

 

為了更好地滿足 團隊成員 個性化需求、規範 告警處理 流程, 曠視科技 不同的告警級別設定成了不同的通知方式。例如,重要級別的告警或者在非工作時間的告警通知都採用電話的通知方式。一般級別的告警透過釘釘來通知,而需要團隊協調處理的告警也可以透過釘釘直接@相關的負責人,極大的降低了團隊成員間的溝通成本。

 

智慧的自動化告警管理 體系讓 曠視科技的運維 團隊做到了“業務有數,心中有路”,每一位同事都在心裡有了指北針 ,輕鬆應對每一條系統告警, 實現工作效率和 系統穩定 的雙重提升。

 

未來可期,需求與工具同步迭代

“我們仍有許多業務需求期待與睿象雲進行深度的合作,將我們的業務系統維護的更加完善,稍後我們將與睿象雲團隊一起探討業務質量分析等運維問題,以便提升更加流暢、更加全面、更便捷的金融級人臉身份核驗業務的 線上化高效施行。 ”曠視科技運維負責人表示。

 

隨著企業需求的不斷更迭,睿象雲開足馬力深度服務客戶的業務需求, 幫助業務運維團隊更加快速的掌握業務健康狀況,甄別運維問題,判定故障根因,預測業務變化趨勢,最終全面提升企業的IT運維能力,降低經營成本和風險,創造更加優質的使用者體驗。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69948837/viewspace-2732502/,如需轉載,請註明出處,否則將追究法律責任。

相關文章