測試merge效率

皇家救星發表於2019-05-15

原文網址 : https://www.cnblogs.com/kingstarer/p/10865941.html

測試說明：

MERGE是oracle提供的一種特殊的sql語法，非常適用於資料同步場景，即：（把A表資料插到B表，如果B表存在相同主鍵的記錄則使用A表資料對B表進行更新）資料同步的常規做法是先嚐試插入，插入失敗再進行更新，MERGE比這種常規做法效率高很多。（特別是A與B表基本一致，同步時主鍵衝突比較多的情況，效率能相差10倍以上）

為了驗證MERGE效率，我建了兩張表，tab_test_C（初始化生成50000條記錄）和tab_test_Q（初始化從tab_test_C生成40000條記錄），寫了兩個plsql指令碼，分別將tab_test_C的資料同步到tab_test_Q，看它們效率區別。

第一個指令碼使用merge語法，第二個指令碼使用常規先插入，出現主鍵衝突的操作。

測試結果：
使用merge語法的指令碼同步資料耗時0.04秒，使用常規操作耗時14.77秒，效率差369倍

測試指令碼：

SET SERVEROUTPUT ON
-- 啟動計時 以便觀察指令碼執行時間
SET TIMING ON
SET TIME ON

-- 資料初始化 
DROP TABLE tab_test_C;
CREATE TABLE tab_test_C 
(
    C1 VARCHAR2(512),
    C2 VARCHAR2(512),
    C3 VARCHAR2(512),
    C4 VARCHAR2(512),
    C5 VARCHAR2(512),
    C6 VARCHAR2(512),
    C7 VARCHAR2(512),
    C8 VARCHAR2(512),
    C9 VARCHAR2(512),
    C10 VARCHAR2(512)
);

DECLARE
    v_total number;
BEGIN
    v_total := 0;
    LOOP
        EXIT WHEN v_total >= 50000;
        for cur in (select owner, object_name, subobject_name, object_id, data_object_id, object_type, 
            created, last_ddl_time, timestamp from all_objects where rownum < 101)
        loop
            insert into tab_test_C values (cur.owner, cur.object_name, cur.subobject_name, 
            cur.object_id, cur.data_object_id, 
            cur.object_type, cur.created, 
            cur.last_ddl_time, cur.timestamp, v_total);
            v_total := v_total + 1;
        end loop;
    END LOOP;
    COMMIT;
END;
/

-- 建唯一索引
select count(1) from tab_test_C;
create UNIQUE INDEX uid_test_c_1 on tab_test_C(C10);

--初始化tab_test_Q表資料，先從tab_test_C生成同步40000條資料，剩下10000條資料使用指令碼同步過來
DROP TABLE tab_test_Q;
CREATE TABLE tab_test_Q AS SELECT * FROM tab_test_C where rownum < 40001;
create UNIQUE INDEX uid_test_q_1 on tab_test_Q(C10);
-- 驗證資料未同步成功 此時記錄數差1000
select count(*) from tab_test_Q;

-- 使用merge語法同步tab_test_C的資料到tab_test_Q
DECLARE
    CURSOR cur is select * from tab_test_C;
    type mergeArray_t is table of tab_test_C % ROWTYPE index by BINARY_INTEGER;
    mergeArray mergeArray_t;
BEGIN
    OPEN cur;
    LOOP
        EXIT WHEN cur % NOTFOUND;
        FETCH cur bulk collect into mergeArray LIMIT 16; -- 每次限十幾條記錄，不要佔用太多記憶體 這個數字調大點效率會更高
        BEGIN
            FORALL rw IN 1 .. mergeArray.count
                MERGE INTO tab_test_Q A
                USING (SELECT mergeArray(rw).C1 C1, mergeArray(rw).C2 C2, mergeArray(rw).C3 C3, mergeArray(rw).C4 C4, 
                    mergeArray(rw).C5 C5, mergeArray(rw).C6 C6, mergeArray(rw).C7 C7, mergeArray(rw).C8 C8, 
                    mergeArray(rw).C9 C9, mergeArray(rw).C10 C10 FROM DUAL) B
                ON (A.C10 = B.C10)
                WHEN MATCHED THEN
                    UPDATE SET A.C1 = mergeArray(rw).C1, A.C2 = mergeArray(rw).C2, A.C3 = mergeArray(rw).C3, 
                        A.C4 = mergeArray(rw).C4, A.C5 = mergeArray(rw).C5, 
                        A.C6 = mergeArray(rw).C6, A.C7 = mergeArray(rw).C7, A.C8 = mergeArray(rw).C8, 
                        A.C9 = mergeArray(rw).C9
                WHEN NOT MATCHED THEN
                    INSERT (C1, C2, C3, C4, C5, C6, C7, C8, C9, C10) VALUES(mergeArray(rw).C1, mergeArray(rw).C2,
                        mergeArray(rw).C3, mergeArray(rw).C4, mergeArray(rw).C5, mergeArray(rw).C6, 
                        mergeArray(rw).C7, mergeArray(rw).C8, mergeArray(rw).C9, mergeArray(rw).C10);
            -- DBMS_OUTPUT.PUT_LINE(mergeArray.count);
        EXCEPTION
            WHEN OTHERS THEN
                    DBMS_OUTPUT.PUT_LINE('error1');
        END;
    END LOOP;
    CLOSE cur;
    COMMIT;
END;
/

--耗時0.04秒
-- 驗證資料同步成功 
select count(*) from tab_test_Q;

--初始化tab_test_Q表資料，先從tab_test_C生成同步40000條資料，剩下10000條資料使用指令碼同步過來
DROP TABLE tab_test_Q;
CREATE TABLE tab_test_Q AS SELECT * FROM tab_test_C where rownum < 40001;
create UNIQUE INDEX uid_test_q_1 on tab_test_Q(C10);
-- 驗證資料未同步成功 此時記錄數差1000
select count(*) from tab_test_Q;

-- 使用常規語法同步tab_test_C的資料到tab_test_Q
BEGIN
    for cur in (select * from tab_test_C)
    LOOP
        BEGIN
            INSERT INTO tab_test_Q(C1, C2, C3, C4, C5, C6, C7, C8, C9, C10) 
            VALUES(cur.C1, cur.C2, cur.C3, cur.C4, cur.C5, cur.C6, cur.C7, cur.C8, cur.C9, cur.C10);
        EXCEPTION
            WHEN DUP_VAL_ON_INDEX THEN --唯一索引衝突時更新
                UPDATE tab_test_Q SET C1 = cur.C1, C2 = cur.C2, C3 = cur.C3, C4 = cur.C4, C5 = cur.C5, C6 = cur.C6, C7 = cur.C7, C8 = cur.C8, C9 = cur.C9
                WHERE C10 = cur.C10;
            WHEN OTHERS THEN
                    DBMS_OUTPUT.PUT_LINE('error1');
        END;
    END LOOP;
    COMMIT;
END;
/

--耗時14.77秒
-- 驗證資料同步成功
select count(*) from tab_test_Q;

測試人員如何提高API功能測試效率？
2019-09-18
API
軟體產品測試之效能效率測試
2022-07-29
如何提高介面測試的效率
2020-08-11
測試團隊效率問題思考
2020-08-17
run_stats---sql效率測試工具(轉)
2019-01-09
SQL
程式池、執行緒池效率測試
2018-03-13
執行緒
手工測試與APPSCAN自動化測試結合的提高效率測試策略
2024-07-08
APP
自動化測試更適合缺陷預防，而不是提高測試效率
2019-08-02
提升軟體測試效率與靈活性：探索Mock測試的重要性
2024-09-22
Mock
如何利用Allure報告提升你的測試效率？
2024-03-04
單元測試效率優化：為什麼要對程式進行測試？測試有什麼好處？
2022-06-29
優化
幀間預測merge、skip、PCM模式
2020-10-20
模式
提升測試效率，為需要軟體測試報告的企業節約時間成本
2022-08-10
測試報告
測試工程師為什麼需要產品思維？5種方式教你提高測試效率！
2022-07-12
工程師
免費試用效率科技SMT智慧首件檢測儀
2020-05-27
測試測試測試測試測試測試
2024-09-03
軟體測試/人工智慧|熟練使用web控制元件定位技巧，提升測試工作效率！
2024-02-26
人工智慧Web控制元件
老程式設計師轉測試配置測試環境設定共享檔案提高團隊效率
2021-02-28
程式設計師
SAP ABAP Gateway Client 裡 OData 測試的 PUT, PATCH, MERGE 請求有什麼區別
2022-08-04
Gatewayclient
點對點傳輸效率對比測試——鐳速傳輸
2023-04-24
python進階（15）多執行緒與多程式效率測試
2021-04-22
Python執行緒
精準測試的軟體產品質量效率變化分析
2018-08-10
如何利用Requestly提升前端開發與測試的效率，讓你事半功倍?
2023-05-07
前端
sql merge into
2018-09-13
SQL
Merge Or Rebase
2024-05-05
git merge
2024-05-17
Git
ou have not concluded your merge (MERGE_HEAD exists)
2018-09-11
你知道這個提高 Java 單元測試效率的 IDEA 外掛嗎
2023-01-26
JavaIdea
要想高效率完成軟體測試工作，請牢記以下幾點！
2022-12-01
【面試題】array_merge 和 array+ 的區別
2019-03-27
面試題
面試官：主說 Git Rebase 和 Git Merge 差異
2022-05-19
面試Git
git merge origin master git merge origin/master區別
2019-09-28
GitAST
SQLServer MERGE 用法
2019-04-15
SQLServer
merge into 用法深思
2019-01-19
merge into基本用法
2018-10-12
Polyphase Merge Sort
2019-05-30
git 中止merge
2024-09-10
Git
關於c++ STL map 和 unordered_map 的效率的對比測試
2021-08-12
C++

測試merge效率

相關文章