2023愛分析・可觀測性平臺市場廠商評估報告:乘雲科技

ifenxi發表於2023-05-09

2023愛分析・可觀測性平臺市場廠商評估報告:乘雲科技

1.    研究範圍定義

IT運維是企業資訊化建設中不可或缺的一環,其作用在於確保系統穩定性、提高效率和降低成本,對企業的業務生產和服務質量有著至關重要的影響。自十四五規劃以來,隨著企業數字化轉型的加速推進,以及信創轉型的大規模鋪開,企業IT架構複雜度日益上升,直接引發了對自身運維體系的更高要求。但與此同時,在政策、需求及供給端的多重因素驅動下,IT運維產業也迎來了前所未有的發展機遇,具體如下:

政策端:多重政策影響,企業IT架構複雜度日益提升,運維體系亟待升級。近年來,多項相關行業政策陸續釋出,企業數字化和信創化轉型逐漸深入。尤其是在以銀行為首的金融領域,在《金融科技發展規劃》等指導意見下,IT架構國產替換以及數字化升級日益頻繁,導致IT環境複雜度大幅提升,企業急需更高質量的運維體系滿足自身使用要求。因此,藉助人工智慧、大資料等先進技術手段,打造智慧化、自動化的運維體系成為了企業保障自身數字化轉型和國產化升級改造順利落地的必然選擇。

需求端:業績增長持續承壓,企業運維體系降本增效勢在必行。企業市場競爭逐步加劇,傳統運維體系效率低且成本高的弊端日益顯著。在業績增長持續承壓的情況下,依託FinOps、CMP等核心技術手段,實現對企業IT運維資源投入情況的全面監控以及合理再分配,從而助力企業降本增效目的的達成,已經勢在必行。

供給端:新興技術高速發展,企業IT運維覆蓋場景進一步延伸。隨著人工智慧、5G、大資料及物聯網等新興技術的高速發展,企業進行運維體系的智慧化升級轉型擁有了更多選擇,同時也能夠向更多場景進行延伸。在遠端運維、可觀測性等多種先進技術應用加持下,企業IT運維覆蓋範圍得到了全面提升,同時也為後續經營體系的整體最佳化升級創造了可行條件。

 

圖:IT運維市場全景地圖

 

雲原生逐漸普及,企業運維環境複雜度也隨之上升,運維資料也呈指數級增長,傳統運維方式已難以適應雲原生場景。因此,面臨海量、雜亂的運維資料和動態複雜的運維環境,如何進行高效、個性化運維,從而提升企業業務能力,是企業不得不思考的問題。此時,可觀測性平臺憑藉其與雲原生環境的高契合度、強大的智慧化能力和上通下達的中臺能力,成為企業解決上述問題的不二之選。

這一背景下,透過深入調研,愛分析遴選出具備成熟解決方案和落地能力的廠商,供企業在做可觀測性平臺廠商選型時提供參考。同時,在該市場下,愛分析重點選取了可觀測性平臺廠商乘雲數字進行能力評估。

 

 

2.     可觀測性平臺市場分析

市場定義:

可觀測性平臺指的是,面向雲原生環境,具備多維度資料(指標、鏈路、日誌等)統一採集儲存、統一資料監測告警、多維資料關聯分析及多種AIOps能力的運維平臺軟體。其核心作用在於,一方面,能夠透過對應用請求呼叫鏈進行追蹤和拓撲分析,解決在雲原生環境下,業務應用端與基礎設施端之間的呼叫鏈不清晰的問題,提升企業問題定位效率;另一方面,能夠透過幫助企業搭建標準化的運維資料池,並結合統一視覺化資料監控告警以及多種AIOps能力,在使企業運維能力全面提質增效的同時,深挖資料價值,賦能運營決策。

甲方終端使用者:

金融、大型央國企、運營商、泛網際網路等企業IT運維部門、決策部門、管理層

甲方核心需求:

隨著企業數字化轉型的全面深入,IT架構複雜度也大幅上升,為保障系統的平穩執行,大多企業基於大量基礎監控工具搭建了運維體系。這一工具體系雖在一定程度上可以提升企業運維能力,但在企業IT架構逐步向雲原生化轉型的趨勢下,其應用請求呼叫鏈不清晰、運維資料割裂、智慧化水平較低以及缺乏資料分析洞察能力等弊端逐漸顯露。因此,可觀測性平臺憑藉能夠幫助企業對全量運維資料進行歸集、監控及分析等核心能力,逐漸成為企業提升整體運維能力的有效手段之一。具體而言,企業對於可觀測性平臺核心需求主要集中在以下幾方面:

 

圖:甲方企業對可觀測性平臺需求示意圖

需要能夠對全量資料進行統一採集、治理和儲存。企業IT架構較為複雜,各層級IT設施所產生的運維資料型別也有著較大差異,如日誌資料、指標資料、鏈路資料等。然而,傳統運維監控體系普遍缺乏完善的統一資料採集、治理和儲存能力,導致不同型別運維資料間割裂現象嚴重,資料價值難以有效發揮,對於運維效率的提升也形成了較大阻礙。同時,傳統資料採集工具,如APM等,底層資源消耗較大,並且容易對業務執行產生影響。因此,是否具備完善的資料採集、治理和儲存能力,是當前企業對於可觀測性平臺的核心關注點。

需要具備統一的視覺化監控告警能力。隨著企業IT系統複雜度進一步上升,為保障系統的整體平穩執行,大多企業會選擇部署不同的監控工具,有針對性的對伺服器、網路、雲基礎設施、核心業務系統等進行運維監控和告警。但由於各監控工具相互獨立,企業無法進行統一監測和告警,整體使用效果大打折扣。因此,是否具備統一的視覺化監測和告警能力,也是企業對於可觀測性平臺的重要需求之一。

需要具備精準的異常定位能力。雲原生體系下,分散式和微服務架構使得企業IT架構複雜度上升,企業IT運維異常問題定位能力受影響較大。底層資源的容器化,使得上層應用與基礎設施間的呼叫鏈變得不清晰,進而嚴重影響了運維體系的排障效率。因此,具備精準的異常定位能力,也成為了企業對於可觀測性平臺的核心要求之一。

需要能支援在不同的雲環境下使用。經過長年數字化轉型積累,大型企業普遍建立了私有云、公有云、混合雲等多種基礎雲平臺。同時,信創政策下,部分企業已開始了信創雲的搭建。因此,能夠支援在不同雲環境中使用,也是企業對於可觀測性平臺的一大核心需求。

除此之外,部分企業對於可觀測性平臺還具備以下期望需求:

需要具備完善智慧化運維功能。企業傳統的運維體系,大多依靠人工進行包含告警分析、根因分析、故障修復等運維工作。隨著業務系統數量的不斷增加,這一方法太過依賴運維人員經驗的侷限性也愈加明顯,導致運維效率難以有效提升,同時運維成本也持續處於較高水平。因此,建立更加智慧化的運維工具體系,提升整體運維效率是目前企業的主要關注點。

需要能夠相容和納管原有監控體系。部分企業經過多年的發展,已經部署了多種監控工具,包括APM、NPM等,整體監控體系執行較為穩定,且已經投入了較多成本。因此,此類企業在部署可觀測平臺時,會要求平臺能夠相容和納管原有監控工具體系。

需要具備優質的海量資料實時處理能力。對於部分數字化水平領先的企業來說,雲原生應用場景已經覆蓋較廣,導致所產生的指標、日誌、鏈路、流量等運維資料可達幾十萬,甚至上百萬級別。因此,此類企業更加關注可觀測性平臺是否具備海量資料實時處理和儲存能力。

廠商能力要求

基於上述甲方核心需求,可觀測性平臺廠商需滿足以下核心能力要求:

在資料的統一採集、治理和儲存方面。廠商所提供產品需要能夠對伺服器、網路、資料庫、上層應用等全棧IT架構所產生的鏈路、日誌、指標、流量等資料進低功耗、零侵擾、統一的自動實時採集。同時,還需能夠對所採集資料進行統一的治理和儲存,幫助企業搭建標準化的運維資料資源池,為後續監控告警以及多維度資料分析應用提供充足支撐,助力整體運維效率的提升。

在統一的視覺化監控告警能力方面。首先,廠商所提供可觀測性平臺產品需能夠對標準化的運維資料資源池進行統一的實時監控,並具備視覺化看板功能,可以實時展現各IT設施的執行狀態。使企業無需再部署多個監控工具,顯著降低資源消耗和成本;其次,當IT設施發生異常後,該平臺能夠實時產生告警資訊,並自動將告警資訊傳送給企業運維人員,幫助企業實現異常問題及時發現和快速處置,進而有效保障業務連續性。

在異常問題的精準定位方面。廠商所提供產品需具備全鏈路追蹤、空間地圖定位等多種核心能力。該平臺能夠透過對應用請求呼叫鏈的追蹤和拓撲分析,幫助企業使用者有效解決在雲原生環境下,業務應用端與基礎設施端之間呼叫鏈不清晰的問題,從而實現問題的精準定位,賦能後續運維工作的快速開展。

在支援不同雲環境下使用方面。廠商所提供產品需要能夠支援在企業原有私有云、公有云及混合雲等不同型別雲平臺上使用,企業無需進行額外的架構改造或大量定製化開發,即可快速產生業務收益,並保障系統的平穩執行;同時,還需能夠完全相容基於國產基礎設施所搭建的信創雲平臺,滿足國產雲平臺對於可觀測性的能力要求,助力企業使用者在國產替換浪潮大規模推進下,建立全面自主可控的IT架構。

針對部分甲方企業的期望需求,廠商還需具備以下可選能力:

在完善的智慧運維功能方面。廠商所提供可觀測性平臺,需具備包括告警分析、根因分析、趨勢預測以及自動化故障處置等在內的多種智慧運維功能。企業使用者透過部署應用該平臺,能夠透過對運維資料進行多個維度的實時分析,幫助企業快速找出異常問題產生的根本原因,並結合自動化故障處置能力,降低人工干預的成本。同時,能夠建立起從故障發現、故障告警、故障分析、到故障處置的全流程自動化和智慧化的運維體系,進而實現運維效率的大幅提升。

在對企業原有監控體系相容納管方面。廠商所提供可觀測性平臺需具備豐富的API介面和統一的管理能力,一方面,能夠支援企業原有監控工具的快速接入,幫助企業進一步發揮原有監控工具的能力和價值;另一方面,還需能夠支援與第三方智慧運維平臺相容使用,幫助企業進一步增強和鞏固自身運維能力。

在海量資料實時處理方面。針對部分數字化水平領先的甲方企業進階需求,廠商所提供產品需具備高效能的海量資料實時處理能力,從技術架構和效能上符合海量資料處理使用需求,並能夠針對企業使用者所產生數十萬和數百萬級別的運維資料進行全量採集、治理、儲存和分析,有效保障雲原生大規模應用下的企業系統穩定性。


入選標準說明:

1.  符合市場定義中的廠商必備能力要求;

2.  2022年Q1至2023年Q1可觀測性平臺付費客戶數量≥5個;

3.  2022年Q1至2023年Q1可觀測性平臺合同收入≥2000萬元。

 

3.     廠商評估: 乘雲數字

廠商介紹:

杭州乘雲數字技術有限公司(簡稱“乘雲數字”),成立於2017年,公司致力於打造高度自動化、智慧化的可觀測性解決方案,簡化企業雲運維、助力企業數字化轉型,實現IT驅動業務的價值階躍。成立迄今,公司已在金融、電力、企業等多個領域、上百家頭部客戶實現產品落地,核心客戶包括但不限於多家股份制/城市商業銀行、多家國家電網電力公司、多家期貨證券保險公司等。

產品服務介紹:

DataBuff 是乘雲數字的核心產品線,該產品採用業界先進的“一體化觀測”理念設計,整合“OneAgent”、“OneCenter”、“內生AIOps”、”SmartMesh“ 等多項專利技術,提供環境中所有觀測資料的攝取、清洗、視覺化、觀測與分析等全流程能力。透過該系統的整體應用,能夠幫助企業實現全域性可觀測,提升異常發現、故障隔離、根因定位的工作效率,幫助企業提前發現問題、預防問題,提升系統穩定性。

廠商評估:

綜合來看,乘雲DataBuff可觀測性平臺在產品設計理念、監控告警能力、故障定位能力、智慧運維能力、以及系統相容能力五方面具備顯著優勢:

先進的”All-In-One”設計理念,賦能企業運維資料價值深挖。乘雲是國內少有的專注於可觀測性領域核心技術研發的IT運維廠商之一。其DataBuff可觀測性平臺基於先進的“All-In-One”一體化設計理念打造,具備“OneAgent一體化資料探針”、“OneCenter一體化資料平臺“等多個專利技術。

 

圖:資料處理流程圖

一方面,依託“OneAgent一體化探針”超智慧採數及超高效能的專利架構設計,使得該平臺在資料採集方面具備低消耗、非侵入、多資料型別等獨特優勢,無需多次呼叫Zabbix等單點工具,即可幫助企業以最低成本快速實現對全棧IT設施所產生的“觀測五件套”資料的自動實時統一採集;

另一方面,結合“OneCenter一體化平臺“所具備的統一資料治理能力,幫助企業搭建全流程自動化的實時運維資料觀測體系,以及標準化的運維資料資源池,有效解決企業資料割裂的問題,為後續多種智慧運維功能提供高保真的資料質量支撐。

全棧式、自動化能力,顯著實現降本增效的目標。首先,乘雲DataBuff可觀測性平臺具備高效的全棧式監控能力,企業透過部署一個探針、一個平臺,即可實現對從主機、程式、網路、雲設施、容器、中介軟體、到上層應用的全棧式的資料與關係探索能力,並圍繞高質量的觀測與診斷分析目標、構建精簡的資料體系,有效擺脫原有多套工具並行的使用模式。

其次,該平臺具備持續自動化的能力。監測複雜環境離不開自動化,DataBuff透過對資料處理流程的每一個環節實現自動化升級,以達到更快的部署、更快的觀測、更快的發現異常、更快的定位問題、更快的處置問題、更快的故障自愈。自動化和智慧化是轉變團隊工作方式的根本所在,二者可以迅速、高效地實現企業級的可觀測能力提升。

圖:某城市商業銀行DataBuff使用效果示意圖

例如,在某城市商業銀行專案中,業務系統逐漸容器化、微服務化,原有搭積木模式不再適用。透過部署DataBuff,基於該平臺所具備的一體化技術,以及靈活的第三方資料攝取能力,幫助該行構建起了一套面向全棧的統一可觀測底座。透過該方案,有效解決行內長期存在的部門牆鴻溝問題,充分覆蓋行內大量的監控盲區、空白地帶,並避免了大量的端點工具疊加帶來的資源浪費。該方案替代傳統搭積木模式,真正達到了降本增效的目標, 為企業減少90%左右的工具成本支出、90%左右的資源成本支出、50%左右的人力成本支出、MTTD/MTTR效率顯著提升。



“無干擾全鏈路追蹤”+“空間地圖”雙重手段,解決雲原生環境下IT運維核心難點。乘雲深耕於雲原生領域多年,對於企業在容器化、微服務化等技術架構下的運維核心痛點有著充分認知。一般在儲存指標、呼叫鏈、日誌及使用者體驗資料時,並不會儲存那些將它們銜接在一起的重要背景資訊。依託乘雲自主研發的“SmartTrace無干擾全鏈路追蹤”和“SmartMesh空間地圖“兩大核心技術,使企業能夠在不對業務應用造成影響的前提下,自動化、實時性的構建整體系統的全層級空間地圖,將拓撲節點與觀測五件套關聯融合、一鍵跳轉,真正實現故障分析與影響面分析的 按圖索驥,問題排查與定位時間提升10倍以上,為後故障快速修復奠定可行條件。

圖:某國家電網省電力公司DataBuff使用效果示意圖

例如,在某省電力公司專案中,基於DataBuff平臺所具備的空間地圖測繪能力,幫助電力公司構建了一張實時、動態、客觀的空間地圖,實現了業務系統的 白盒化觀測,有效解決了電力公司業務系統“ 上雲不可見”的難題,有效彌補了現有工具只採集資料、不採集關係的技術短板。自平臺部署以來,該行在微服務關係透視、資料關聯上大幅提升效率,真正實現了故障分析的按圖索驥。

行業領先的“內生AIOps“引擎,助力企業IT運維能力全面提質增效。乘雲DataBuff可觀測性平臺內建了行業首創的”內生AIOps引擎“,能夠為企業使用者提供包括智慧降噪、智慧告警分析、多維資料關聯分析、確定性根因分析、趨勢預測分析以及自動化故障處置等多種智慧運維核心能力。透過該平臺的全面部署應用,將可觀測從資料採集升級到提供答案,使企業可以快速搭建從問題發現、問題分析、問題處置到問題預測的閉環智慧運維體系,實現整體運維能力的提質增效。

圖:某股份制銀行DataBuff使用效果示意圖

例如,在某國有股份制銀行專案中,透過乘雲DataBuff可觀測性平臺的整體部署應用,基於該平臺所具備的一體化觀測,以及先進的“內生AIOps引擎“,幫助該行構建起了面向應用、平臺、基礎設施、使用者體驗的全棧式一體化觀測和智慧運維體系,實現了整體運維效率的顯著提升。有效解決該行每逢交易高峰期關鍵系統頻發故障,但問題處理效率低下的問題。自平臺部署以來,該行問題故障處置時間 從原近一個小時,大幅下降至10分鐘,業務連續性得到了有效保障。

  靈活多樣的系統相容能力,保障在複雜IT環境下的長久使用。乘雲DataBuff可觀測性平臺具備優秀的開放融合產品特性,一方面,能夠全面支援在企業原有私有云、公有云及混合雲環境下的快速部署使用,大幅降低產品部署和系統改造成本;另一方面,其DataBuff產品已全面相容當前主流國產伺服器、作業系統、資料庫、信創雲等底層基礎設施,並取得了互信認證,可支援在不同架構的國產IT基礎環境中使用,有效保障企業IT國產化替換過程中的平穩過渡;此外,乘雲DataBuff可觀測性平臺還具備豐富的API介面,能夠支援與企業原有監控工具的快速對接,以及與第三方智慧運維平臺的相容使用,進一步增強企業整體運維能力,加速數字化轉型程式。

 

典型客戶:

中國銀行、華夏銀行、中國太平保險、天翼支付、上海期貨交易所、國家電網、南方電網、吉利集團、中國聯通、中國電信、中國移動等

 

4.     入選證照

 

2023愛分析・可觀測性平臺市場廠商評估報告:乘雲科技

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69993021/viewspace-2950872/,如需轉載,請註明出處,否則將追究法律責任。

相關文章