PostgreSQL/GreenPlum Merge Inner Join解密
PostgreSQL/GreenPlum Merge Inner Join 解密
1、什麼是Merge Join
合併連線是一種匹配演算法,其中外表的每個記錄與內表的每個記錄進行匹配,直到存在連線子句匹配的可能性為止。 僅當兩個表都已排序並且 join子句的運算子是“=”時 ,才使用該演算法。
如下圖所示: merge join的位元組點需要Sort節點對內外表進行排序,然後進行join。
2、Merge Inner Join狀態機
狀態機如下圖所示:
EXEC_MJ_INITIALIZE_OUTER
該狀態是初始狀態,首先要從外表進行掃描。獲取外表記錄。根據外表掃描的記錄進行判斷:
1) 外表為空,即掃描出來的記錄為空,或者第一個 join條件的左表值為NULL並且null排序後放在最後且為inner join,則結束join,返回NULL
2) 左表值為 NULL或者null排序後放在前面,則重新進入EXEC_MJ_INITIALIZE_OUTER狀態,掃描左表
3) 非上述兩種條件,則進入 EXEC_MJ_INITIALIZE_INNER狀態,獲取內表記錄
EXEC_MJ_INITIALIZE_INNER
該狀態下掃描內表。根據掃描的記錄進行判斷:
1) 內表為空,即掃描出來的記錄為空,或者 第一個 join條件的左表值為NULL並且null排序後放在最後且為inner join,則結束join,返回NULL
2) 內表值為 NULL或者null排序後放在前面,則重新進入EXEC_MJ_INITIALIZE_INNER狀態,掃描右表
3) 非上述兩種條件,則進入 EXEC_MJ_SKIP_TEST狀態
EXEC_MJ_SKIP_TEST
該狀態需要對左右表值進行 join條件比較,根據比較結果判斷:
1) 左 = 右:標記內表排序後當前掃描位置;標記當前掃描的slot,進入EXEC_MJ_JOINTUPLES狀態
2) 左 < 右:進入EXEC_MJ_SKIPOUTER_ADVANCE狀態,掃描左表下一條記錄
3) 左 > 右:進入EXEC_MJ_SKIPINNER_ADVANCE狀態,掃描右表下一條記錄
EXEC_MJ_SKIPOUTER_ADVANCE
該狀態掃描外表下一條記錄。根據掃描的記錄進行判斷:
1) 外表掃描完,即掃描出來的記錄為空,或者第一個 join條件的左表值為NULL並且null排序後放在最後且為inner join,則結束join,返回NULL
2) 左表值為 NULL或者null排序後放在前面,則重新進入EXEC_MJ_SKIPOUTER_ADVANCE狀態,掃描左表
3) 非上述兩種條件,則進入 EXEC_MJ_SKIP_TEST狀態,進行比較
EXEC_MJ_SKIPINNER_ADVANCE
該狀態掃描內表下一條記錄,根據掃描的記錄進行判斷:
1) 內表掃描完,即掃描出來的記錄為空,或者第一個 join條件的左表值為NULL並且null排序後放在最後且為inner join,則結束join,返回NULL
2) 內表值為 NULL或者null排序後放在前面,則重新進入EXEC_MJ_SKIPINNER_ADVANCE狀態,掃描內表
3) 非上述兩種條件,則進入 EXEC_MJ_SKIP_TEST狀態,進行比較
因為左 > 右才會進入該狀態,右時一個NULL,那麼左表後面的值肯定也比右的前一個值大,所以join結束。
EXEC_MJ_JOINTUPLES
該狀態下,將左右表的值進行連線投影,輸出結果。下個週期呼叫 ExecMergeJoin函式時,直接進入EXEC_MJ_NEXTINNER狀態。
EXEC_MJ_NEXTINNER
該狀態下,掃描內表下一條記錄。並根據掃描的記錄進行判斷:
1) 內表掃描完,即掃描出來的記錄為空,或者第一個 join條件的左表值為NULL並且null排序後放在最後且為inner join,則進入EXEC_MJ_NEXTOUTER狀態
2) 內表值為 NULL或者null排序後放在前面,則進入EXEC_MJ_NEXTOUTER狀態
3) 非上述兩種條件,進行比較,根據比較值進行操作:
左 = 右:進入EXEC_MJ_JOINTUPLES狀態
左 < 右:進入EXEC_MJ_NEXTOUTER狀態
不可能有左 > 右的分支,因為該狀態由 ① 分支而來,排序都是由小到大,所以要麼相等,要麼右邊大
EXEC_MJ_NEXTOUTER
該狀態下獲取外表的下一條記錄,並根據值進行判斷:
1) 外表掃描完,即掃描出來的記錄為空,或者第一個 join條件的左表值為NULL並且null排序後放在最後且為inner join,則結束join,返回NULL
2) 左表值為 NULL或者null排序後放在前面,則重新進入EXEC_MJ_NEXTOUTER狀態,獲取外表下一條記錄
3) 非上述兩種條件,則進入 EXEC_MJ_JOINTUPLES狀態,否則進入EXEC_MJ_TESTOUTER狀態
EXEC_MJ_TESTOUTER
該狀態下,獲取標記的內表值,並與外表值比較
1) 左 = 右:需要標記內表排序的位置,並將當前slot放到mj_InnerTupleSlot中
2) 左 > 右:重新獲取右表當前掃描的位置的記錄
(1) 內表掃描完,或者內表記錄為 NULL並且第一個join條件並且null排在最後,結束join,返回NULL
(2) 內表記錄為 NULL,並且非第一個join條件或null排在前面,進入EXEC_MJ_SKIPINNER_ADVANCE狀態,獲取內表下一條記錄
(3) 非上述 2種情況,進入EXEC_MJ_SKIP_TEST狀態
不可能有左 < 右的分支,因為該狀態由 ① 而來,排序都是由小到大,要麼相等,要麼左邊大。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31493717/viewspace-2919755/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- MySQL LEFT JOIN/ INNER JOIN/RIGHT JOINMySql
- mysql left join轉inner joinMySql
- Inner join 寫法
- join、inner join、left join、right join、outer join的區別
- Inner Join, Left Outer Join和Association的區別
- sql的left join 、right join 、inner join之間的區別SQL
- mysql中的left join、right join 、inner join的詳細用法MySql
- 要命的MERGE JOIN CARTESIAN
- mysql的left join和inner join的效率對比,以及如何優化MySql優化
- mysql INNER JOIN、LEFT JOIN、RIGHT JOIN;內連線(等值連線)、左連線、右連線MySql
- 聊一聊Greenplum與PostgreSQLSQL
- SAP ABAP CDS view 裡 INNER JOIN 和 Association 的區別View
- 多表連線的三種方式詳解 hash join、merge join、 nested loopOOP
- 資料庫實現原理#3(Merge Join).md資料庫
- 【SQL】13 SQL 別名、SQL 連線(JOIN)、SQL INNER JOIN 關鍵字、SQL LEFT JOIN 關鍵字、SQL RIGHT JOIN 關鍵字、SQL FULL OUTER JSQL
- PostgreSQL 技術內幕(五)Greenplum-Interconnect模組SQL
- PostgreSQL 邏輯複製解密SQL解密
- PostgreSQL邏輯複製解密SQL解密
- PostgreSQL,SQLServer邏輯增量(通過邏輯標記update,delete)同步到Greenplum,PostgreSQLSQLServerdelete
- 基於Greenplum,postgreSQL的大型資料倉儲實踐SQL
- 直播|PostgreSQL 技術內幕(五)Greenplum-Interconnect模組SQL
- 【greenplum】greenplum叢集搭建
- mysql求交集:UNION ALL合併查詢,inner join內連線查詢,IN/EXISTS子查詢MySql
- Sqlserver update\delete用inner join關聯,會update\delete關鍵字後面的表關聯到的行SQLServerdelete
- @Inner使用及原理
- PostgreSQL 原始碼解讀(208)- 查詢#121(Valid OUTER JOIN Optimizations)SQL原始碼
- static inner class和非static inner class的例項化問題(can only instantiate non-static inner class...)
- LINUX inner-process communicationLinux
- 檢視spark程式/區分pyspark和pandas的表的合併,pyspark是join,pandas是mergeSpark
- Mysql同步到GreenplumMySql
- Greenplum介紹-PartitionedTable
- greenplum 4.3.33安裝
- [Greenplum] 擴容segment
- 微課sql最佳化(16)、表的連線方法(5)-關於Merge Join(排序合連線)SQL排序
- Mysql join 的本質,Nested Loop Join 和 Hash JoinMySqlOOP
- sql merge intoSQL
- Merge Or Rebase
- git mergeGit