Citus 分散式 PostgreSQL 叢集 - SQL Reference(查詢處理)

為少發表於2022-03-31

原文網址 : https://www.cnblogs.com/hacker-linner/p/16080581.html

一個 Citus 叢集由一個 coordinator 例項和多個 worker 例項組成。資料在 worker 上進行分片和複製，而 coordinator 儲存有關這些分片的後設資料。向叢集發出的所有查詢都通過 coordinator 執行。 coordinator 將查詢劃分為更小的查詢片段，其中每個查詢片段可以在分片上獨立執行。然後協調器將查詢片段分配給 worker，監督他們的執行，合併他們的結果，並將最終結果返回給使用者。查詢處理架構可以通過下圖進行簡要描述。

Citus 的查詢處理管道涉及兩個元件：

分散式查詢計劃器和執行器
PostgreSQL 計劃器和執行器

我們將在後續部分中更詳細地討論它們。

分散式查詢計劃器

Citus 的分散式查詢計劃器接收 SQL 查詢並規劃它以進行分散式執行。

對於 SELECT 查詢，計劃器首先建立輸入查詢的計劃樹，並將其轉換為可交換和關聯形式，以便可以並行化。它還應用了一些優化以確保以可擴充套件的方式執行查詢，並最大限度地減少網路 I/O。

接下來，計劃器將查詢分為兩部分 - 在 coordinator 上執行的 coordinator 查詢和在 worker 上的各個分片上執行的 worker 查詢片段。然後，計劃器將這些查詢片段分配給 worker，以便有效地使用他們的所有資源。在這一步之後，分散式查詢計劃被傳遞給分散式執行器執行。

分佈列上的鍵值查詢或修改查詢的規劃過程略有不同，因為它們恰好命中一個分片。一旦計劃器收到傳入的查詢，它需要決定查詢應該路由到的正確分片。為此，它提取傳入行中的分佈列並查詢後設資料以確定查詢的正確分片。然後，計劃器重寫該命令的 SQL 以引用分片表而不是原始表。然後將該重寫的計劃傳遞給分散式執行器。

分散式查詢執行器

Citus 的分散式執行器執行分散式查詢計劃並處理故障。執行器非常適合快速響應涉及過濾器、聚合和共置連線的查詢，以及執行具有完整 SQL 覆蓋的單租戶查詢。它根據需要為每個分片開啟一個與 woker 的連線，並將所有片段查詢傳送給他們。然後它從每個片段查詢中獲取結果，合併它們，並將最終結果返回給使用者。

子查詢/CTE Push-Pull 執行

如有必要，Citus 可以將來自子查詢和 CTE 的結果收集到 coordinator 節點中，然後將它們推送回 worker 以供外部查詢使用。這允許 Citus 支援更多種類的 SQL 構造。

例如，在 WHERE 子句中包含子查詢有時不能與主查詢同時執行內聯，而必須單獨執行。假設 Web 分析應用程式維護一個按 page_id 分割槽的 page_views 表。要查詢前 20 個訪問量最大的頁面上的訪問者主機數，我們可以使用子查詢來查詢頁面列表，然後使用外部查詢來計算主機數。

SELECT page_id, count(distinct host_ip)
FROM page_views
WHERE page_id IN (
  SELECT page_id
  FROM page_views
  GROUP BY page_id
  ORDER BY count(*) DESC
  LIMIT 20
)
GROUP BY page_id;

執行器希望通過 page_id 對每個分片執行此查詢的片段，計算不同的 host_ips，並在 coordinator 上組合結果。但是，子查詢中的 LIMIT 意味著子查詢不能作為片段的一部分執行。通過遞迴規劃查詢，Citus 可以單獨執行子查詢，將結果推送給所有 worker，執行主片段查詢，並將結果拉回 coordinator。 push-pull(推拉) 設計支援上述子查詢。

讓我們通過檢視此查詢的 EXPLAIN 輸出來瞭解這一點。它相當參與：

GroupAggregate  (cost=0.00..0.00 rows=0 width=0)
  Group Key: remote_scan.page_id
  ->  Sort  (cost=0.00..0.00 rows=0 width=0)
    Sort Key: remote_scan.page_id
    ->  Custom Scan (Citus Adaptive)  (cost=0.00..0.00 rows=0 width=0)
      ->  Distributed Subplan 6_1
        ->  Limit  (cost=0.00..0.00 rows=0 width=0)
          ->  Sort  (cost=0.00..0.00 rows=0 width=0)
            Sort Key: COALESCE((pg_catalog.sum((COALESCE((pg_catalog.sum(remote_scan.worker_column_2))::bigint, '0'::bigint))))::bigint, '0'::bigint) DESC
            ->  HashAggregate  (cost=0.00..0.00 rows=0 width=0)
              Group Key: remote_scan.page_id
              ->  Custom Scan (Citus Adaptive)  (cost=0.00..0.00 rows=0 width=0)
                Task Count: 32
                Tasks Shown: One of 32
                ->  Task
                  Node: host=localhost port=9701 dbname=postgres
                  ->  HashAggregate  (cost=54.70..56.70 rows=200 width=12)
                    Group Key: page_id
                    ->  Seq Scan on page_views_102008 page_views  (cost=0.00..43.47 rows=2247 width=4)
      Task Count: 32
      Tasks Shown: One of 32
      ->  Task
        Node: host=localhost port=9701 dbname=postgres
        ->  HashAggregate  (cost=84.50..86.75 rows=225 width=36)
          Group Key: page_views.page_id, page_views.host_ip
          ->  Hash Join  (cost=17.00..78.88 rows=1124 width=36)
            Hash Cond: (page_views.page_id = intermediate_result.page_id)
            ->  Seq Scan on page_views_102008 page_views  (cost=0.00..43.47 rows=2247 width=36)
            ->  Hash  (cost=14.50..14.50 rows=200 width=4)
              ->  HashAggregate  (cost=12.50..14.50 rows=200 width=4)
                Group Key: intermediate_result.page_id
                ->  Function Scan on read_intermediate_result intermediate_result  (cost=0.00..10.00 rows=1000 width=4)

讓我們把它拆開並檢查每一塊。

GroupAggregate  (cost=0.00..0.00 rows=0 width=0)
  Group Key: remote_scan.page_id
  ->  Sort  (cost=0.00..0.00 rows=0 width=0)
    Sort Key: remote_scan.page_id

樹的 root 是 coordinator 節點對 worker 的結果所做的事情。在這種情況下，它正在對它們進行分組，並且 GroupAggregate 要求首先對它們進行排序。

    ->  Custom Scan (Citus Adaptive)  (cost=0.00..0.00 rows=0 width=0)
      ->  Distributed Subplan 6_1
.

自定義掃描有兩個大子樹，從“分散式子計劃”開始。

        ->  Limit  (cost=0.00..0.00 rows=0 width=0)
          ->  Sort  (cost=0.00..0.00 rows=0 width=0)
            Sort Key: COALESCE((pg_catalog.sum((COALESCE((pg_catalog.sum(remote_scan.worker_column_2))::bigint, '0'::bigint))))::bigint, '0'::bigint) DESC
            ->  HashAggregate  (cost=0.00..0.00 rows=0 width=0)
              Group Key: remote_scan.page_id
              ->  Custom Scan (Citus Adaptive)  (cost=0.00..0.00 rows=0 width=0)
                Task Count: 32
                Tasks Shown: One of 32
                ->  Task
                  Node: host=localhost port=9701 dbname=postgres
                  ->  HashAggregate  (cost=54.70..56.70 rows=200 width=12)
                    Group Key: page_id
                    ->  Seq Scan on page_views_102008 page_views  (cost=0.00..43.47 rows=2247 width=4)
.

工作節點為 32 個分片中的每一個執行上述內容（Citus 正在選擇一個代表進行顯示）。我們可以識別 IN (...) 子查詢的所有部分：排序、分組和限制。當所有 worker 完成此查詢後，他們會將其輸出傳送回 coordinator，coordinator 將其組合為“中間結果”。

      Task Count: 32
      Tasks Shown: One of 32
      ->  Task
        Node: host=localhost port=9701 dbname=postgres
        ->  HashAggregate  (cost=84.50..86.75 rows=225 width=36)
          Group Key: page_views.page_id, page_views.host_ip
          ->  Hash Join  (cost=17.00..78.88 rows=1124 width=36)
            Hash Cond: (page_views.page_id = intermediate_result.page_id)
.

Citus 在第二個子樹中啟動另一個執行器作業。它將在 page_views 中計算不同的主機。它使用 JOIN 連線中間結果。中間結果將幫助它限制在前二十頁。

            ->  Seq Scan on page_views_102008 page_views  (cost=0.00..43.47 rows=2247 width=36)
            ->  Hash  (cost=14.50..14.50 rows=200 width=4)
              ->  HashAggregate  (cost=12.50..14.50 rows=200 width=4)
                Group Key: intermediate_result.page_id
                ->  Function Scan on read_intermediate_result intermediate_result  (cost=0.00..10.00 rows=1000 width=4)
.

工作人員使用 read_intermediate_result 函式在內部檢索中間結果，該函式從 coordinator 節點複製的檔案中載入資料。

這個例子展示了 Citus 如何使用分散式子計劃在多個步驟中執行查詢，以及如何使用 EXPLAIN 來了解分散式查詢執行。

PostgreSQL 計劃器和執行器

一旦分散式執行器將查詢片段傳送給 worker，它們就會像常規 PostgreSQL 查詢一樣被處理。該 worker 上的 PostgreSQL 計劃程式選擇在相應分片表上本地執行該查詢的最佳計劃。 PostgreSQL 執行器然後執行該查詢並將查詢結果返回給分散式執行器。您可以從 PostgreSQL 手冊中瞭解有關 PostgreSQL 計劃器和執行器的更多資訊。最後，分散式執行器將結果傳遞給 coordinator 進行最終聚合。

計劃器
- http://www.postgresql.org/docs/current/static/planner-optimizer.html
執行器
- http://www.postgresql.org/docs/current/static/executor.html

Citus 分散式 PostgreSQL 叢集 - SQL Reference(查詢分散式表 SQL)
2022-03-30
分散式SQL
Citus 分散式 PostgreSQL 叢集 - SQL Reference(手動查詢傳播)
2022-04-01
分散式SQL
Citus 分散式 PostgreSQL 叢集 - SQL Reference(建立和修改分散式表 DDL)
2022-03-27
分散式SQL
Citus 分散式 PostgreSQL 叢集 - SQL Reference(SQL支援和變通方案)
2022-04-02
分散式SQL
Citus 分散式 PostgreSQL 叢集 - SQL Reference(攝取、修改資料 DML)
2022-03-28
分散式SQL
分散式 PostgreSQL 叢集(Citus)官方安裝指南
2022-03-20
分散式SQL
分散式 PostgreSQL 叢集(Citus)官方示例 - 實時儀表盤
2022-03-17
分散式SQL
分散式 PostgreSQL 叢集(Citus)官方示例 - 時間序列資料
2022-03-18
分散式SQL
分散式 PostgreSQL 叢集(Citus)官方教程 - 遷移現有應用程式
2022-03-16
分散式SQL
分散式 PostgreSQL 叢集(Citus)，分散式表中的分佈列選擇最佳實踐
2022-03-21
分散式SQL
分散式PostgreSQL之Citus
2022-03-24
分散式SQL
分散式 PostgreSQL 叢集(Citus)官方示例 - 多租戶應用程式實戰
2022-03-15
分散式SQL
在 Kubernetes 上快速測試 Citus 分散式 PostgreSQL 叢集(分散式表，共置，引用表，列儲存)
2022-03-24
分散式SQL
分散式 PostgreSQL - Citus 架構及概念
2022-03-06
分散式SQL架構
分散式 PostgreSQL - Citus 架構及概念
2022-03-07
分散式SQL架構
StackGres 資料庫平臺工程，使用 Citus + Patroni 建立生產級高可用分散式 PostgreSQL 分片叢集
2023-12-05
資料庫分散式SQL
PostgreSQL函式：返回表查詢結果集
2018-11-18
SQL函式
Citus 11(分散式 PostgreSQL) 文件貢獻與本地執行
2022-05-02
分散式SQL
PostgreSQL 原始碼解讀（31）- 查詢語句#16（查詢優化-表示式預處理#1）
2018-09-03
SQL原始碼優化
PostgreSQL 原始碼解讀（32）- 查詢語句#17（查詢優化-表示式預處理#2）
2018-09-03
SQL原始碼優化
PostgreSQL 原始碼解讀（33）- 查詢語句#18（查詢優化-表示式預處理#3）
2018-09-05
SQL原始碼優化
PostgreSQL 原始碼解讀（34）- 查詢語句#19（查詢優化-表示式預處理#4）
2018-09-05
SQL原始碼優化
ElasticSearch 分散式叢集
2021-03-01
Elasticsearch分散式
elasticsearch(三)---分散式叢集
2018-08-21
Elasticsearch分散式
HA分散式叢集搭建
2018-04-10
分散式
HDFS分散式叢集搭建
2024-07-07
分散式
golang分散式與叢集
2021-12-22
Golang分散式
hadoop分散式叢集搭建
2021-03-04
Hadoop分散式
秒級查詢之開源分散式SQL查詢引擎Presto實操-上
2022-12-08
分散式SQLREST
叢集故障處理之處理思路以及健康狀態檢查（三十二）
2019-08-07
postgresql dba常用sql查詢語句
2019-08-27
SQL
利用SQL Profiler處理開銷較大的查詢
2018-03-09
SQL
Hadoop分散式叢集搭建_1
2018-05-17
Hadoop分散式
叢集和分散式區別
2018-03-03
分散式
Hadoop完全分散式叢集配置
2021-05-01
Hadoop分散式
PostgreSQL 查詢替換函式
2021-12-21
SQL函式
Kafka分散式查詢引擎
2020-11-30
Kafka分散式
使用並查集處理集合的合併和查詢問題
2022-06-03
並查集

Citus 分散式 PostgreSQL 叢集 - SQL Reference(查詢處理)

分散式查詢計劃器

分散式查詢執行器

子查詢/CTE Push-Pull 執行

PostgreSQL 計劃器和執行器

更多

相關文章