一、實時數倉

　　當前，企業對於資料實時性的需求越來越迫切，因此需要實時數倉來滿足這些需求。傳統的離線數倉的資料時效性通常為 T+1，並且排程頻率以天為單位，無法支援實時場景的資料需求。即使將排程頻率設定為每小時，也僅能解決部分時效性要求較低的場景，對於時效性要求較高的場景仍然無法優雅地支撐。因此，實時資料使用的問題必須得到有效解決。實時數倉主要用於解決傳統數倉資料時效性較低的問題，通常會用於實時的 OLAP 分析、實時資料看板、業務指標實時監控等場景。　　

　　 二、實時數倉架構介紹

　　2.1 Lambda架構

　　Lambda 架構將資料分為實時資料和離線資料，並分別使用流式計算引擎（例如 Storm、Flink 或者 SparkStreaming）和批次計算引擎（例如 Hive、Spark）對資料進行計算。然後，將計算結果儲存在不同的儲存引擎上，並對外提供資料服務。　　

　　2.2 Kappa架構

　　Kappa 架構將所有資料來源的資料轉換為流式資料，並將計算統一到流式計算引擎上。相比 Lambda 架構，Kappa 架構省去了離線資料流程，使得流程變得更加簡單。Kappa 架構之所以流行，主要是因為 Kafka 不僅可以作為訊息佇列使用，還可以儲存更長時間的歷史資料，以替代 Lambda 架構中的批處理層資料倉儲。流處理引擎以更早的時間作為起點開始消費，起到了批處理的作用。　　

　　 三、攜程酒店實時數倉架構　　

　　3.1 方案選型

　　（1）架構選型：Lambda+OLAP 變體架構。Lambda 架構具有靈活性高、容錯性高、成熟度高和遷移成本低的優點，但是實時資料和離線資料需要分別使用兩套程式碼。OLAP 變體架構將實時計算中的聚合計算由 OLAP 引擎承擔，從而減輕實時計算部分的聚合處理壓力。這樣做的優點是既可以滿足資料分析師的實時自助分析需求，並且可以減輕計算引擎的處理壓力，同時也減少了相應的開發和維護成本。缺點是對OLAP 引擎的資料寫入效能和計算效能有更高的要求。

　　（2）實時計算引擎選型: Flink 具有 Exactly-once 的準確性、輕量級 Checkpoint 容錯機制、低延時高吞吐和易用性高的特點。SparkStreaming 更適合微批處理。我們選擇了使用 Flink。

　　（3）OLAP選型：我們選擇 StarRocks 作為 OLAP 計算引擎。主要原因有3個：

　　StarRocks 是一種使用MPP分散式執行框架的資料庫，叢集查詢效能強大。

　　StarRocks 在高併發查詢和多表關聯等複雜多維分析場景中表現出色，併發能力強於 Clickhouse，而攜程酒店的業務場景需要 OLAP 資料庫支援每小時幾萬次的查詢量。

　　攜程酒店的業務場景眾多，StarRocks 提供了4種儲存模型，可以更好的應對各種業務場景。

　　四、實際案例—攜程酒店實時訂單

　　4.1 資料來源

　　Mysql Binlog，透過攜程自研平臺 Muise 接入生成 Kafka。

　　4.2 ETL資料處理

　　問題一: 如何保證訊息處理的有序性?

　　Muise 保證了 Binlog 訊息的有序性，我們這要討論的是 ETL 過程中如何保證訊息的有序性。舉個例子，比如說一個酒店訂單先在同一張表觸發了兩次更新操作，共計有了兩條 Binlog 訊息，訊息1和訊息2會先後進入流處理裡面，如果這兩個訊息是在不同的 Flink Task 上進行處理，那麼就有可能由於兩個併發處理的速度不一致，導致先發生的訊息處理較慢，後發生的訊息反而先處理完成，導致最終輸出的結果不對。　　

　　上圖是一個簡化的過程，業務庫流入到 Kafka，Binlog 日誌是順序寫入的，根據主鍵進行 Hash 分割槽，寫到 Kafka 裡面，保證同一個主鍵的資料寫入 Kafka 同一個分割槽存。Flink 消費 Kafka 時，需要設定合理的併發，保證一個分割槽的資料由一個 Task 負責，另外儘量採用邏輯主鍵來作為 Shuffle Key，從而保證 Flink 內部的有序性。最後在寫入 StarRocks 的時候，要按照主鍵進行更新或刪除操作，這樣就能保證端到端的一致性。

　　問題二：如何生產實時訂單寬表？

　　為了方便分析師和資料應用使用，我們需要生成明細訂單寬表並儲存在 StarRocks 上。酒店訂單涉及業務過程相對複雜，資料來源來自於多個資料流中。且由於酒店訂單變化生命週期較長，客人可能會提前幾個月甚至更久預訂下單。這些都給生產實時訂單寬錶帶來一定的困難。　　

　　上圖中生成訂單寬表的 SQL 在離線批處理的時候通常沒有問題，但在實時處理的情景下就很難行的通。因為在實時處理時，這個 SQL 會按照雙流 Join 的方式依次處理，每次只能處理一個 Join，所以上面程式碼有9個 Join 節點，Join 節點會將左流的資料和右流的資料全部儲存下來，這樣就會導致我們這個 Join 的過程需要儲存的資料規模放大9倍。

　　我們採用了 Union all+Group by 的方式替代 Join；就是用 Union All 的方式，把資料錯位拼接到一起，後面加一層 Group By，相當於將 Join 關聯轉換成 Group By，這樣不會放大 Flink 的狀態儲存，而且在增加新的流時，相比 Join，狀態儲存的增加也可以忽略不計，新增資料來源的成本近乎為0。　　

　　還有一個問題，上面有介紹過酒店訂單的生命週期很長，用 union all 的方式，狀態週期只儲存了30分鐘，一些訂單的狀態可能已經過期，當出現訂單狀態時，我們需要獲取訂單的歷史狀態，這樣就需要一箇中間層儲存歷史狀態資料來做補充。歷史資料我們選擇存放在 Redis 中，第一次選擇從離線資料匯入，實時更新資料同時更新 Redis 和 StarRocks。

　　問題三：如何做資料校驗？

　　實時資料存在資料丟失或邏輯變更未及時的風險，為了保證資料的準確性，每日凌晨用資料更新時間在 T-1 和離線資料做比對，如果資料校驗不一致，會用離線資料更新 StarRocks 中這部分資料，並排查原因。

　　整體流程見下圖:　　

　　4.3 攜程酒店實時訂單表的應用效果

　　酒店實時訂單表的資料量為十億級，維表資料量有幾百萬，現已經在幾十個資料看板和監控報表中使用，資料包表通常有二三十個維度和十幾個資料指標，查詢耗時99%約為3秒。

　　4.4 總結

　　酒店實時資料具有量級大，生命週期長，業務流程多等複雜資料特徵，攜程酒店實時數倉選用 Lambda+OLAP 變體架構，再借助 Starrocks 強大的計算效能，不僅降低了實時數倉開發成本，同時達到了支援實時的多維度資料統計、分析、監控的效果，在實時庫存監控以及應對緊急突發事件等專案獲得了良好效果。

乾貨 | 攜程酒店實時數倉架構和案例

相關文章