Kylin建立Cube

sas???發表於2018-05-16

根據上篇文章Kylin建立Model之後,建立Cube

第一步,Cube Info

填寫Cube基本資訊


7260028-7a581c3333a68810.png

7260028-882381bcb0510abc.png

第二步,Dimensions

7260028-ded81ec4f88621cc.png

第三步,Measures

7260028-a193222273975895.png

第四步,Refresh Setting

Auto Merge Thresholds :自動合併閾值,按天增加的segement,每60天合併一次;60天的segment每120天合併一次
Retention Threshold:預設為0,保留歷史所有的segment

Partition Start Date:分割槽開始時間


7260028-856dada2462aeef9.png

第五步,Advanced Setting

Mandatory Dimensions:強制維度,表示當前ID的Aggregation Group中的所有Cuboid的每一個Cuboid都包含該項配置的維度
Hierarchy Dimensions:層級維度,當有多個維度能夠存在層級關係,可以在該配置項中,將這些維度配置為層級維度
例如,產品、客戶、售賣員三個維度
Joint Dimensions:聯合維度,聯合維度中的多個維度,在查詢中,要麼一起出現,要麼都不出現。

7260028-1c813e8ed7369c9e.png

Encoding:編碼,指定了該維度的值應該使用何種方式進行編碼,選用合適的編碼能夠有效減少維度對空間是使用,在大資料量情況下效果明顯。

Shard By:按維度對資料進行分片,預設Cuboid的資料分片策略是隨機的,並且只能設定一個維度為Share By。

如果Cuboid中的某些行的Shard By Dimension的值是相同的,那麼這些行的資料最終將會分配到同一個分片中。

例如:好多酒店都在一個城市當中,如果將CITYID維度設定為Share By,則同一個城市的酒店資料將分配到同一個分片中。


7260028-4671c157bb937563.png
image.png

第六步,Configuration Overwrites

覆蓋kylin.properties中的配置


7260028-269f0fc87c3be869.png

第七步,Overivew

Cube概覽,點選Save儲存


7260028-ca1a1ec8a57acca8.png

第八步,Build

7260028-b7adde9a27b844e8.png

相關文章