資料儲存--面向列的儲存設計

b10l07發表於2018-01-22

如果你的資料倉儲中的事實資料表擁有大量的資料（參見前文），儲存和查詢資料的難度會大大上升。
在大多數OLTP系統中，資料儲存都是以面向行(row-oriented)的方式組織的。這種方式把一行資料存放在一起。
在OLAP系統中，查詢語句一般是獲取大量行資料中的特定某幾列。這裡就需要引入面向列(column-oriented)儲存的概念：相比於面向行儲存把一行資料相鄰存放，面向列儲存把一列的資料存放在一起。

面向列儲存示例

面向列儲存還有一個好處：處於同一列的資料往往具有某些相似性，這種特性會方便資料的壓縮處理。

bitmap壓縮示例

需要注意的一點是，谷歌知名的BigTable有一個列族(column families)的概念(HBase和Cassandra也一併繼承了這個概念)。但是同一列族的資料仍然也行為單位存放在一起，所以BigTable本身更貼近於面向行的資料儲存。
雖然面向列的儲存把同一列的資料存放在一起，但是在常規查詢的時候，還是應該按某一列的值按行把所有列的資料排序。比如某一操作需要經常按時間維度獲取資料，正確的做法是按時間列升序或者降序來按行把所有資料排序，這樣執行時間的區間查詢時效率比較高。
如果排序列中只含有少數幾個值的話，不妨使用bitmap將列進行壓縮，來減少空間佔用。
既然資料本身就要做冗餘災備，而且各個查詢請求對排序列的要求也可能不同，不妨在不同的資料節點上按不同的排序列來儲存多份資料。針對不同的查詢請求，選擇最合適的資料節點響應查詢請求，發生了部分當機之後最多造成查詢條件下降。
前面說到，資料倉儲常用做資料分析，這就意味著使用max,min,count,sum,avg等方法比獲取原始資料更為普遍。所以資料倉儲常常對某些列的統計值進行快取來減少計算量，這種方法叫物化檢視(materialized view)。每當發生寫操作時，物化檢視都要被更新計算，所幸OLAP系統一般是週期性大批量寫入，經常大批量讀取。

資料儲存--檔案儲存
2024-05-26
聚焦資料時代新儲存需求，浪潮儲存的新儲存之道
2020-12-03
資料庫設計：儲存過程
2016-07-05
資料庫儲存過程
資料儲存
2016-12-28
資料庫表設計之儲存引擎
2021-06-28
資料庫儲存引擎
資料儲存(1)：從資料儲存看人類文明-資料儲存器發展歷程
2020-07-27
Flutter持久化儲存之資料庫儲存
2019-03-08
Flutter持久化資料庫
資料儲存(歸檔解檔，沙河儲存)
2018-03-27
儲存系統設計指南之儲存分類
2009-01-07
Android中的資料儲存之檔案儲存
2020-03-11
Android
資料儲存：CoreData
2019-03-05
iOS 資料儲存
2022-07-18
iOS
IOS資料儲存
2016-10-12
iOS
k8s之資料儲存-配置儲存
2021-08-19
K8S
IOS資料儲存之檔案沙盒儲存
2016-05-11
iOS
資料庫設計：儲存過程主體
2016-07-05
資料庫儲存過程
【儲存資料恢復】儲存上的raid5陣列崩潰的資料恢復案例
2022-05-24
資料恢復AI陣列
SAP Sybase IQ按列儲存介紹 - 1 按列儲存
2017-12-26
資料儲存-領存高速海量資料記錄儲存模組產品介紹
2021-04-08
塊儲存檔案儲存物件儲存
2020-05-28
物件
MongoDB後設資料的儲存介紹
2016-06-10
MongoDB
資料的儲存區域
2019-05-11
有效儲存資料的方法
2022-09-29
python的資料儲存
2017-09-18
Python
iOS中的資料儲存
2017-12-14
iOS
k8s之資料儲存-高階儲存
2021-08-18
K8S
浪潮儲存提出雲存智用、運籌新資料的新儲存之道
2020-12-13
Android的3種資料儲存技術（一）File儲存
2020-11-12
Android
iOS開發資料儲存篇—iOS中的幾種資料儲存方式
2018-11-29
iOS
RocketMQ(十)：資料儲存模型設計與實現
2021-01-02
MQ模型
Android 程式設計日誌之資料儲存
2016-06-30
Android程式設計
SRAM資料儲存原理
2020-06-05
TiDB資料儲存
2020-10-13
TiDB
java 資料儲存方式
2017-09-22
Java
Hive之資料儲存
2017-09-18
Hive
列式儲存資料庫
2015-04-20
資料庫
Salesforce的多型儲存和SAPC4C的後設資料儲存倉庫
2019-02-14
Salesforce多型
資料成本：雲端儲存成本高嗎如何節省資料儲存成本
2022-05-12

資料儲存--面向列的儲存設計

相關文章