非結構化資料暴增,企業如何穩定高效的支撐日均百億級訪問

禿頭也愛科技發表於2022-12-02

 

5G 時代來臨,遊戲、影片直播成為當下最為熱門的娛樂方式,網上衝浪更快更滿足。但資料量的爆發式增長帶來的系統響應速度遲緩、資料庫無損擴容難、資料儲存成本陡增等問題撲面而來。

 

以影片業務為例,每秒10萬業務請求時,單表產生的資料量可能會高達數十億。資料量暴增則需要擴容,對於傳統自建資料庫,擴容過程非常複雜,資料庫系統擴容需要提前幾個月去做規劃,細緻的部署,縝密的實施,需經歷上線-灰度-再驗證等過程,由於業務有變化起伏,當業務高峰過了後需要面臨縮容的痛苦,否則將會造成極大的資源浪費,這是傳統架構帶來的必然問題。

 

今天就來聊聊華為雲GaussDB(for Cassandra)面對內容分發、影片直播等領域如何更低成本助力企業乘風破浪,快速應對業務百億資料量增長。

 

無憂遷移百億資料量,分鐘級快速擴充套件

首先,解決無憂搬遷海量資料尤為重要,華為雲資料庫提供了資料複製服務DRS,在不影響業務的情況下,可搬遷資料規模超過10TB,單表高達數百億資料;同時可支援將資料反向同步到源庫,可保證兩邊的資料一致性。

其次,華為雲GaussDB(for Cassandra) 多副本策略下沉到共享儲存,大幅提升彈性伸縮能力,計算節點按需擴充套件,不需要做資料遷移;支援一鍵擴縮容,擴縮容耗時僅分鐘級別,相比開源Cassandra擴容時長提升幾十倍,可輕鬆應對業務變化。

降低成本、無損升級,業務無感知

相比開源Cassandra,相同效能下的引擎規格,華為雲GaussDB(for Cassandra) 2U8G規格的費用僅為開源Cassandra 8U32G規格的70%,同時免去了後續擴容儲存等資料搬遷各項工作。此外,華為雲GaussDB(for Cassandra)提供了無損升級方案,實現升級期間業務基本無感知。

輕鬆滿足多維度、大資料量複雜查詢場景

在資訊流、內容分發場景中,華為雲GaussDB(for Cassandra)自身在寫效能上具有先天優勢,針對客戶查詢場景複雜及查詢效能要求高的特點,GaussDB在大資料量查詢效能進行了最佳化,引入檢視增強特性,並對錶結構進行最佳化設計,滿足了資訊流、內容搜尋等業務的查詢需求。

支援內容自動推薦,流服務助力客戶輕鬆捕獲資料變更

內容分發場景,客戶使用最多的便是自動推薦系統,由於傳統NoSQL資料庫無法做搜尋引擎,所以需要將資料同步到搜尋服務中支撐搜尋功能。在內容管理業務中,一般都會用到經典應用場景---資料變更捕獲完成資料同步,華為雲GaussDB(for Cassandra) 實現了Stream功能,支援資料同步到搜尋引擎中,完美支撐了線上大資料分析,內容自動推薦等場景。

支撐離線大資料分析,支援豐富的檔案型別

一般來說,網際網路內容分發平臺在使用者系統、內容處理、資訊流服務等場景中都有資料離線匯出的需求。而需要分析的資料系統會定期匯出到OBS(物件儲存服務)上,等分析資料時再從OBS上獲取資料進行分析處理。華為雲GaussDB(for Cassandra)對匯出的過程進行了最佳化,縮短匯出時長,增加匯出的檔案型別,支援更多的離線分析系統、離線分析能力。

當前,華為雲GaussDB(for Cassandra)成功賦能了工業製造、氣象業、網際網路等行業,其中助力華為消費者雲高效管理全球最大Cassandra節點1萬+。華為雲GaussDB(for Cassandra)透過解決大叢集、大資料量下的效能穩定、資料一致性、可用性等問題,可支撐企業業務快速增長。此外,數字化時代下,影片直播、內容分發給人們帶來了更為精準的娛樂體驗,華為雲GaussDB也將持續打造先進的技術,讓人們更快樂的享受數字化服務。

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70022909/viewspace-2926455/,如需轉載,請註明出處,否則將追究法律責任。

相關文章