今天對之前描述的問題一條insert語句導致的效能問題分析（一) 進行了進一步的補充。
有一條insert語句的主要效能瓶頸在於insert子句中的查詢語句，查詢中的主要資源消耗在於對兩個表進行了多次關聯
語句主要的結構如下：
insert into xxxxx (select * from TEST_vip_new minus select * from TEST_vip_new_bak
        ) a left join TEST_vip_new_bak b
        on a.cn=b.cn
對於這個test_vip_new和test_vip_new_bak我產生了疑問，覺得這個臨時表test_vip_new_bak有些多餘。帶著這種思路分析，看起來邏輯很簡單啊，於是就聯絡了開發的同學，一起討論一番。
但是討論完之後，還是讓我有些不知所措。
首先，語句為什麼要多次關聯，自己做了一個小的測試，感覺這種關聯方式還是有些多餘。
SQL> create table a (id number);
Table created.
SQL> create table b (id number);
Table created.
SQL> insert into a values(1);
1 row created.
SQL> insert into a values(2);
1 row created.
SQL> insert into b values(1);
1 row created.
SQL> select * from a minus select * from b;
        ID
----------
         2
SQL> select *from a left join b on a.id=b.id;
        ID         ID
---------- ----------
         1          1
         2
如果按照這樣的思路，仿照原來的結構輸出就是下面這樣的結果。
SQL> select *from (select * from a minus select * from b) a left join b on a.id=b.id;
        ID         ID
---------- ----------
         2
但是和開發討論了一番，發現我的想法有些簡單了，具體的場景中資料過濾的邏輯比上面這種略微複雜一些。
透過一個兩個測試表來模擬。
create table a (id1 number,id2 number);create table game_new (id1 number,id2 number);
create table game_new_bak (id1 number,id2 number);
如果原來的資料內容為（1,1），在執行儲存過程之後，會修改為（1,2）
SQL> insert into game_new values(1,2);
1 row created.
然後儲存過程在執行過程中，會插入一些新的資料，假設為(2,2)
SQL> insert into game_new values(2,2);
1 row created.
而臨時表game_new_bak中的資料是儲存過程執行之前的資料狀態，即（1,1）
SQL> insert into game_new_bak values(1,1);
1 row created.
按照這種情況，兩個表做了minus操作之後會輸出兩行，即修改之後的資料和新增的資料。
而這個需求需要實現的是，根據id1進行匹配，把修改前的id2一併輸出。這樣就知道修改前是什麼樣的資料了，如果是新增的，那這列的值就保持為空。
SQL>   select a.id1,a.id2,b.id2 from (select * from game_new minus select *from game_new_bak) a left join game_new_bak b on a.id1=b.id1
       ID1        ID2        ID2
---------- ---------- ----------
         1          2          1
         2          2
如果是這樣的情況，就完全可以使用一次表關聯就可以改進。可以用下面的形式。
select a.id1,a.id2,b.id2 from game_new a ,game_new_bak b where a.id1=b.id1(+)
所以就建議語句從原來的形式
SELECT A.CN,A.GRADE,A.RANK,A.SCORE,DECODE(SIGN
(A.RANK-(NVL(B.RANK,-1))),1,2,-1,3,0,1),
SYSDATE,(NVL(B.RANK,-1)),B.SIGN,B.FLAG,B.TAG,B.SCORE FROM ( SELECT *
FROM GAME_VIP_NEW MINUS SELECT * FROM GAME_VIP_NEW_BAK ) A LEFT JOIN
GAME_VIP_NEW_BAK B ON A.CN=B.CN
修改為：
SELECT /*+parallel(4)*/ A.CN,A.GRADE,A.RANK,A.SCORE,DECODE(SIGN
(A.RANK-(NVL(B.RANK,-1))),1,2,-1,3,0,1),
SYSDATE,(NVL(B.RANK,-1)),B.SIGN,B.FLAG,B.TAG,B.SCORE FROM GAME_VIP_NEW a,cydba.GAME_VIP_NEW_BAK B
where A.CN=B.CN(+)
考慮到執行的情況和資源情況，加了一個並行，可以在一定程度上緩解這個問題。
在本地的環境中進行了測試，發現幾分鐘就可以輕鬆搞定，做了基本的確認，就和開發進行了反饋，對線上的儲存過程內容進行了修改。
這個問題的解決也就終於告一段落。

一條insert語句導致的效能問題分析（二)

相關文章