阿里雲Tair究竟何方神聖?

魚論發表於2022-06-21

近期,Gartner公佈了2020年度全球雲資料庫魔力象限評估結果,阿里雲表現極為亮眼,首次挺進全球雲資料庫第一陣營——領導者(LEADERS)象限,這也是中國資料庫40年來首次進入全球頂級資料庫行列。


在雲資料庫賽道上,其營收已經躍居全球第三,在中國市場份額也首次超過了Oracle。



眾所周知,阿里雲資料庫在OLTP、OLAP板塊實力強勁,有自研的PolarDB和ADB(AnalyticDB 形成雙品牌。去年在第六屆世界網際網路大會上,PolarDB當選世界網際網路領先科技成果。最近,又斬獲了2020年中國電子學會科技進步一等獎。而AnalyticDB在今年中旬獲浙江科技進步一等獎,並在TPC-DS打榜成績第一。


那麼,問題來了,阿里雲資料庫有沒有短板呢?有,就在NoSQL板塊,阿里雲缺乏一個強勁的品牌產品,但這個短板在 TairLindorm出現後,將成為過去式。


12月13日,老魚受邀參加了由阿里雲主辦的2020雲記憶體資料庫峰會暨Tair大賽頒獎典禮,這是阿里雲首場線下雲記憶體資料庫峰會。



參加這場活動的原因是出於好奇。“Tair”是什麼?,這是一個陌生的名字。更關鍵的是,在此次主要參會嘉賓名單中,老魚看到了阿里雲智慧資料庫NoSQL產品線總經理的名字。


Tair、記憶體資料庫、NoSQL產品線,這其中有什麼關聯?


Tair 是什麼


會後,老魚在採訪阿里雲資料庫負責人李飛飛時瞭解到,“Tair”是一個品牌,阿里雲自研雲原生記憶體資料庫品牌,後續該品牌將會正式商業化,其歸屬於NoSQL產品線。


阿里雲智慧資料庫NoSQL產品線包含2大核心產品,分別是雲原生多模資料庫Lindorm,雲原生記憶體資料庫Tair。


實際上“Tair”在阿里集團誕生已經有十餘年,2004年,淘寶開始應用快取技術。最先投入應用的是基於前端頁面的快取技術,採用ESI來標識可以加速和不能加速的網頁內容片段,有效減少了從服務端抓取整個頁面的次數。


隨著淘寶網的流量快速增長,資料庫的壓力與日俱增,基於後端系統的快取技術應運而生。從服務淘寶詳情和驗證碼等業務的持久化系統TBStore,到初始服務於淘寶使用者中心的TDBM等等,後端系統快取技術經歷了多個系統和階段的演變與積累,到2009年,這些系統、技術經驗經過進一步的研發,融合成了阿里巴巴大規模高速儲存系統Tair。



基於這個阿里集團內部使用的Tair產品研發的雲上託管鍵值對記憶體服務,就是阿里雲自研雲原生記憶體資料庫Tair,(又稱Redis企業版),100% 相容開源社群版的 Redis。


如今,基於Tair演進的Redis企業版已經是阿里巴巴集團呼叫量最大的系統之一,在多年的阿里巴巴雙十一全球狂歡節上提供了核心的線上訪問加速能力,承受住了每秒數億次的呼叫。


Tair 商業價值


阿里云為什麼要做Tair?其商業價值何在?李飛飛在演講中說的很清楚。


先看傳統記憶體資料庫面臨哪些挑戰?


第一、成本的挑戰,記憶體是所有儲存元件中最貴的一部分,這個不用多說。

第二、彈效能力的挑戰,傳統記憶體資料庫很難根據業務的波峰、波谷變化來實時調整或者使用,彈性部署不同容量的記憶體,彈效能力是受限的;

第三、多模資料的挑戰;對半結構化、非結構化豐富計算模型多模的計算處理能力是客戶的需求。

第四、企業級能力;


再看趨勢,2020年全球資料規模40ZB,2025年全球資料規模相比2020年會有爆炸性的430%以上的增長。


2025年實時資料佔比30%,2022年,50%的新業務將會採用實時分析。


其中一個關鍵的變化是非結構性資料佔比會大大提升,非結構化資料佔比將會高達50%以上,同比增速也會到50%以上。


基於以上資料,並結合資料上雲的趨勢,阿里雲得出一個結論:


在傳統針對結構化資料的關係型資料庫市場之外,一定會有一個更大的針對半結構化非結構化資料的非關係型資料庫的市場,並且這個市場很大的挑戰是如何將半結構化、非結構化資料的處理實時線上化。


這就是今天,為什麼阿里雲打造雲原生實時線上的多模資料庫Lindorm,會結合最新的硬體,如傲騰( Intel AEP),去打造下一代Tair記憶體資料庫的原因。


要解決以上挑戰,僅僅靠軟體層面、演算法層面的突破是不夠的。這也是李飛飛談到解鎖存算一體,實現真正的儲存計算在記憶體層面一體化的背後邏輯。


Tair 產品選擇


從產品型別及特性來看,Tair又分為三個不同形態的產品,分別是效能增強型、持久記憶體型、容量儲存型。其區別主要在儲存介質上,分別是DRAM、Intel AEP、ESSD雲盤。對應的是客戶選型的3大核心指標:訪問延時、持久化需要、整體成本。



效能增強型,適合以滿足業務效能需求為主的客戶,如資料讀寫頻繁,要求低延遲,支援大連線,對成本相對不敏感。


從官方給出的資料,吞吐達到開源Redis的2倍以上,熱點訪問能力數十萬每秒,能同時支撐30~50K併發連線。


持久記憶體型,適合對延遲和吞吐有近乎記憶體的需求,整體儲存資料量又比較大,持久化,成本控制較記憶體更高的客戶。


從官方給出的資料,其效能近似記憶體,具備有記憶體90%的吞吐能力,而成本降低35%。


容量儲存型,適合資料讀寫密集程度低,延遲要求相對不高,儲存容量要求高的客戶,成本是最大考量因素。


從官方給出的資料,On ESSD的版本成本最低可達到全記憶體版本的15%,容量可達到百T級別,並且解決了開源Redis固有的Fork問題而不得不預留部分記憶體的問題。


很顯然,在雲記憶體資料庫上,阿里雲給予了客戶更多選擇,並切入了一個新興的市場。基於AEP和自研記憶體引擎,並結合神龍裸金屬伺服器推出的Tair持久記憶體版本。在目前看來,是其他競爭對手不具備的。


Gartner報告指出,具有前瞻性眼光,並且願意為產品持續投入,擁有豐富的資料庫種類覆蓋度和完善的產品佈局,能解決客戶各種應用場景需求,是阿里雲資料庫能夠成為市場領導者並能夠引領資料庫市場的重要原因。


如今,阿里雲又定義了未來5年雲記憶體資料庫的發展思路!

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70018962/viewspace-2901852/,如需轉載,請註明出處,否則將追究法律責任。

相關文章