資料的儲存和查詢分離不利查詢效能 - thenewstack

banq發表於2022-05-07

資料領域充斥著供應商、行業專家,甚至是記者,他們支援將儲存和計算解耦的優點。畢竟,解耦的方法更容易獨立地擴充套件計算和儲存,它既適合雲的業務模型,也適合其物件儲存架構
但這裡有一點通常不會大聲說出來:解耦儲存通常不利於查詢效能。如果您希望查詢(尤其是可操作的查詢)快速執行,則將資料定位在計算附近或計算資料所在的位置通常是更好的方法。

這正是Ocient在其同名的超大規模資料倉儲的最新版本中所做的。它的架構使其計算和儲存儘可能位於同一位置,該公司表示這會產生巨大的效能提升。

誠然,在一些部署中,將計算與儲存解耦不僅是可行的,而且是最好的選擇。通常情況下,這些應用對時間的敏感性較低,涉及的資料量較小,或者是由主流雲資料倉儲提供服務的工作負載的一部分,這些資料在任何情況下都可能快取在與計算相鄰的儲存層。

但是,例如電信公司通常執行政策模型,確定第二天的流量路由規則。如果實現資料儲存和查詢分離:他們需要花幾個小時來執行,因為這是一個巨大的機器學習模型。耦合計算和儲存的頂級系統在幾秒鐘內完成這些工作。這種方式對於根據涉及天氣、安全、體育比賽等方面的晚間突發事件來重新安排手機塔的流量是非常有價值的。

詳細點選標題

相關文章