通過Snapshot Standby來精確評估SQL效能

jeanron100發表於2016-07-27

    最近處理了一個需求，比較緊急，對映到資料庫層面是需要更新17萬id的值，聽起來是不少，根據資料架構進行了分析，發現目前是做了分庫分表的方式，所以這17萬的id在這些分庫中都可能存在，而跨部門的資料交付中，也沒有做分庫的區分，所以拿到的id是一個籠統的概念，即哪個id對應哪個分庫沒有事先過濾甄別，這個工作就自然而然的下落到了DBA頭上。
   分庫分表的方式，目前有12個分庫，是以十二個使用者的形式體現出來的，所以如果要整體更新，那麼每個分庫都需要更新一遍，有匹配的資料就更新，否則忽略。如此一來，更新的資料規模是就有幾種計算方式，一種是每個id更新對應一條sql語句，那麼語句就有17000*12=2040000條，200多萬條，規模是相當驚人了。執行期間的鎖暫且不考慮，光是執行時間在毫秒，百萬的基數也會把差距放大。還有一種思路是提供12個sql語句，每個分庫各一條sql語句，把17萬的id放入一個臨時表中，關聯更新，這種方式執行時間肯定相比單條語句要長，但是具體多多少還是未知數。
    尤其是線上系統，關鍵的業務系統，這類的操作就尤其敏感。如果有幾種方案，需要給出一個基本的分析和評定，哪種更好，有什麼準確的資料呢，主庫中是萬萬使不得，需要有把握再動手。所以我隆重推薦使用Snapshot Standby來實現這類需求，評估效能，預估影響範圍和操作時間，在完全一致的資料基礎上操作，得到的資料更加有說服力。
我想了幾個方案作為備用方案：
方法:
每個id對應1個sql，17萬sql*12個分庫

方法2:
一個臨時表，12個分庫，12個sql

方法3:
一個臨時表，12個分庫，並行執行

方法4:
每個id對應1個sql,12個分庫並行執行

這些方案在Snapshot Standby的環境中都可以輕鬆實現。主要原理是基於閃回日誌，而亮點則在於備庫可讀可寫，測試完畢之後可以繼續閃回，應用最新的資料變更。
而對於上面方案中的臨時表，我的考慮是基於外部表，因為本身要把這些資料匯入，用完之後還得刪除，熱插拔的方式更加實惠。
建立外部表的語句如下：
CREATE TABLE test_uin
      (uin    varchar2(30)
       )
    ORGANIZATION EXTERNAL
      (TYPE ORACLE_LOADER
      DEFAULT DIRECTORY batch_query_dir
      ACCESS PARAMETERS
        (
        RECORDS DELIMITED BY NEWLINE
        )
      LOCATION ('uin.txt')
     );

開啟備庫為Snapshot Standby
DGMGRL> convert database s2test0 to snapshot standby;
Converting database "s2test0" to a Snapshot Standby database, please wait...
Database "s2test0" converted successfully
DGMGRL> show configuration;

Configuration - test0_dg

Protection Mode: MaxPerformance
Databases:
    stest032 - Primary database
    stest0   - Physical standby database
    s2test0 - Snapshot standby database

Fast-Start Failover: DISABLED

Configuration Status:
SUCCESS
首先我測試了臨時表通過insert填充資料的步驟，17萬的id，用了大概5分鐘。由此可想如果是12個分庫，17萬id更新，那麼序列下來，少說也要1個小時，這個對於線上系統來說是很嚴重的延遲了。
然後我在這個備庫中進行關聯更新。
原來的語句如下:
update TEST_USER_INFO set status=-99 where uin=?;
改為臨時表的結果集來處理。
update TEST_USER_INFO set status=-99 where uin in (select uin from test_uin);
這種方式大概用了30秒的時間就在12個分庫順利完成，平均每個分庫大概是2秒鐘的執行效率。
如此一來有了很精確的評估，所以實施起來就會很得心應手，而在部署前，得到的臨時調整，需要修改的id變為了38萬，當然看起來資料翻了一倍，但是執行效率還是槓槓的。大概是30秒就順利完成。所以通過這種方式還是能夠很精準的分析潛在的效能問題，而對於上面逐步分析的集中測試場景，其實有了這些資料就瞭然於胸。

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/23718752/viewspace-2122657/，如需轉載，請註明出處，否則將追究法律責任。

怎樣確保專案評估的精確（轉）
2007-08-09
系統效能評價---效能評估
2018-08-28
如何正確的評估redis過期時間
2016-05-05
Redis
通過貝葉斯公式來評估功能難度和返工率
2018-05-02
公式
JuiceFS 效能評估指南
2021-12-08
UI
Convert a Physical Standby Database into a Snapshot Standby Database
2019-05-10
Database
Linux效能評估工具
2018-12-07
Linux
網路效能評估（六）
2015-04-08
精益管理培訓的效果可以透過哪些方式評估？
2024-04-15
【DG】之 Snapshot standby模式
2016-10-22
模式
Physical Standby Database 切換到 Snapshot Standby Database
2014-08-26
Database
通過pl/sql來格式化sql
2015-03-03
SQL
效能優化-使用 RAIL 模型評估效能
2018-02-06
優化AI模型
日本希望通過信用評估阻止加密貨幣犯罪活動
2018-06-27
加密
AIX 5.3主機效能評估
2013-12-20
AI
記憶體效能評估（四）
2015-04-08
記憶體
snapshot standby快照備庫角色
2016-10-22
Data Guard - Snapshot Standby Database配置
2017-07-10
Database
通過shell和sql結合查詢效能sql
2014-08-18
SQL
Rust非同步框架的效能評估
2022-04-20
Rust非同步框架
Linux伺服器效能評估
2014-02-10
Linux伺服器
機器學習筆記之效能評估指標
2018-04-25
機器學習筆記指標
AIX系統磁碟I/O效能評估
2009-07-10
AI
OBC充電機測試效能評估
2024-10-30
Index 時間評估(來自eygle)
2016-05-20
Index
通過錯誤的sql來測試推理sql的解析過程
2015-11-28
SQL
評估類、評估類別、評估級別關係
2011-07-14
SQL Server Snapshot
2011-09-28
SQLServer
【SQL】【思念】請Oracle協助得到孩子的精確年齡（精確到秒）
2009-08-22
SQLOracle
【火爐煉AI】機器學習011-分類模型的評估：準確率，精確率，召回率，F1值
2018-08-06
AI機器學習模型
通過java來格式化sql語句
2015-03-01
JavaSQL
通過錯誤的sql來測試推理sql的解析過程(二)
2016-02-12
SQL
資料庫效能需求分析及評估模型
2018-05-14
資料庫模型
web伺服器效能評估和監視
2024-03-20
Web伺服器
多通道負載測試和效能評估？
2024-11-12
負載
Clusternet 成為首批通過工信部開源成熟度評估專案！！！
2021-12-23
11g Dataguard中的snapshot standby特性
2016-04-27
oracle 11g中的snapshot standby特性
2015-08-10
Oracle

通過Snapshot Standby來精確評估SQL效能

相關文章