GBase8a資料分佈規劃
GBase8aMPP 叢集效能取決於各個節點整體的效能,每個節點儲存的資料量對於 叢集效能有很大影響,為了儘可能達到最好的效能,所有的資料節點應該儘量儲存 等量的資料,因此在資料庫表規劃定義階段要考慮表是複製表還是分佈表,以及對 分佈表上的某一些列設定為分佈列進行 hash 分佈。 例如根據資料的分佈特性設計,可以: 1. 將字典表或者維度表建成複製表的方式將資料儲存到各個節點上,即不須對其數 據進行分片儲存。因為字典表的資料量相對較小,雖然在各個節點進行儲存有一定 的資料冗餘,但和事實表的 JOIN 運算就可在本地進行,避免節點間搬動資料。 2. 對於事實表(大表)可將資料分佈到不同的節點上儲存,分佈方法可採用隨機分 布 ( 目前很少用 ) ,或者單列 hash 分佈,或者多列 hash 分佈的方法, SQL 執行的查 詢條件滿足只在其中部分節點時,查詢優化可決定 SQL 的執行僅在這些節點執行 即可。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69979511/viewspace-2884647/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- GBase8a分佈列選取原則
- 資料劃分
- 資料標準規劃有哪些規劃
- GBase8a資料排序優化排序優化
- 實驗-資料分佈對執行計劃的影響.txt
- 01 分數規劃
- 01分數規劃
- oracle資料庫的劃分Oracle資料庫
- SAP資料庫的劃分資料庫
- [資料結構] 劃分樹資料結構
- 動態規劃之數的劃分動態規劃
- 資料庫與動態規劃資料庫動態規劃
- 大資料分析學習規劃大資料
- 說說資料中心佈線的整體規劃薦
- 淺談HBase的資料分佈
- 整數劃分問題(動態規劃)動態規劃
- 機器學習之資料集的劃分機器學習
- 大資料如何改變城市規劃大資料
- 集團業務資料體系規劃
- 資料統計分析 — 泊松分佈
- 資料分佈決定SQL寫法SQL
- Hash分割槽表及資料分佈
- 空間劃分的資料結構資料結構
- 分數規劃學習筆記筆記
- mongodb資料庫範圍分片資料分佈不均勻MongoDB資料庫
- 通過 SQL 實現行轉列(列的資料條目、資料分佈是不規則的)SQL
- 1.2.3. 任務3:資料庫規劃資料庫
- MySQL:如何對待分佈偏移的資料MySql
- 「分散式技術專題」資料分佈(原理、資料分片)分散式
- 電商資料分析指標體系劃分指標
- 資料倉儲主題域如何劃分
- AliosThings的Flash劃分規則iOS
- (動態規劃)最小分糖果問題動態規劃
- 商場分佈圖是怎麼做,地圖資料分佈圖怎麼做地圖
- 新核心業務系統資料架構規劃與資料治理架構
- 資料產品規劃到底該怎麼做?
- 合理的商品結構規劃–資料資訊圖
- 2022年Q2全球按周內天數劃分DDoS攻擊分佈(附原資料表)