閃回區空間不足引發的SQL問題分析

dbasdk發表於2016-10-02

原文網址 : http://blog.itpub.net/29734436/viewspace-2125829/

有一天上班的時候，收到一封報警郵件。
ZABBIX-監控系統:
------------------------------------
報警內容: archive_area_usage
------------------------------------
報警級別: PROBLEM
------------------------------------
監控專案: archive_area_usage：ARCHIVED LOG-->70.25-->
------------------------------------
報警時間:2016.09.20-08:52:47

可以看出是閃回區快滿了，當然我設定了閾值70%，比Oracle預設的80%要更低一些，希望儘可能早的發現這些潛在的問題。
碰到這個問題，讓我有些奇怪。
現在伺服器端都有預設的crontab來設定定期刪除過期的歸檔，怎麼閃回區還會這麼快就滿了呢。這類問題的原因相對來說複雜一些，如果說從資料庫層面來看，如果在10gR2的版本中，可能出現這種情況，那就是有些命令的相容性問題導致，如果是系統層面可能就是就是儲存路徑失效，比如nfs掛載點失效等導致。
目前這個資料庫是11gR2，儲存都是本地磁碟。
我們來看看crontab的設定，可以看出是每個小時會執行，觸發的頻率較高，如果每天觸發一次，如果存在這個問題可能還能理解，為什麼在這種頻率下刪除歸檔依舊閃回區空間不足？
$ crontab -l
*/50 * * * * . $HOME/.bash_profile;$HOME/dbadmin/scripts/rman_trun_arch.sh
我們來看看指令碼的內容。我貼出關鍵的部分。
可以看出歸檔的刪除過期歸檔，保留時間是10個小時之內，其實已經算是很短的了。保留近半天的歸檔而已。
rman target / <<EOF
CONFIGURE ARCHIVELOG DELETION POLICY TO APPLIED ON STANDBY;
crosscheck archivelog all;
delete noprompt expired archivelog all;
delete noprompt archivelog until time "sysdate-10/24";
exit
EOF
如此頻率下怎麼還會有這類問題。看看當前閃回區的情況。

可以看到已經存在300多個歸檔。
這問題確實有意思了，有大量的歸檔，有頻繁的刪除策略，但是閃回區還報錯。
我們來換個姿勢看這個問題，就是檢視歸檔頻率。

這個指令碼的強大的之處就在於可以檢視近2周的歸檔頻率，通過這種方式就可以看出這個問題其實是一個週期性的。在週二會定期出現，只是之前沒有引起重視而已。
可以看到每個小時的歸檔頻率極高，按照這種情況，6個小時就會積累300多個歸檔，一個歸檔日誌成員是1G來算，那麼這個歸檔量就很大了。
一個統計庫怎麼這麼忙，這是一個問題，我們來看看資料庫的負載情況。

可以看到在早間的時候資料庫的負載還是有很大的提升。
那麼這個時間段內是否有SQL引起的如此的變化，比如一個AWR報告，比如一個指令碼就能夠定位。
當然抓到罪魁禍首是關鍵，我是使用指令碼來做，抓到了下面的語句。發現了不少負載高的查詢語句。

進一步定位，發現都有千絲萬縷的關鍵，那就是其中一個儲存過程呼叫，會呼叫裡面的一些SQL語句。
最終發現SQL語句是這樣的形式
SQL_FULLTEXT
----------------------------------------------------------------------------------------------------
UPDATE TESTINFO A SET A.MAX_LEVEL = NVL((SELECT USER_CLASS FROM ROLE_CLASS_INFO B WHERE A.GROUPID =
B.GROUP_ID AND B.CN_GUID = A.ROLE_GUID), A.MAX_LEVEL) WHERE DRAWED = 'Y'

看這個語句其實邏輯也不復雜，但是如果檢視資料量就會發現這個工作量真是太大了，兩個表都是億級的資料量。

按照過濾條件，資料量2億，過濾得到4千萬，都不是小數目，所以全表看來也是一種方案。
SQL> select DRAWED,count(*)from test.testinfo group by DRAWED;
D   COUNT(*)
- ----------
Y   43807108
N 216762221
Elapsed: 00:00:36.17
但是顯然這裡還是存在一些需要確認的地方，這個語句本該不需執行，至少不應該在統計層面來保證資料的業務邏輯一致性，應該在OLTP系統中就應該保證，所以我的努力方向就是取消這個JOB，這種優化才是最有效的。

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/23718752/viewspace-2125524/，如需轉載，請註明出處，否則將追究法律責任。

Oracle資料庫閃回區空間不足
2023-02-07
Oracle資料庫
rac使用預設閃回區歸檔空間滿
2024-02-04
[20180423]表空間閃回與snapshot standby
2018-04-23
排查和解決 CentOS 伺服器磁碟空間不足問題
2024-06-10
CentOS伺服器
磁碟空間不足
2019-10-12
SQL Server Profiler(P)導致C盤空間不足
2019-09-28
SQLServer
Ubuntu空間不足，如何擴容
2022-10-08
Ubuntu
2.6.3 指定閃回區
2020-03-09
[20180419]關於閃回的一些問題.txt
2018-04-23
boot分割槽剩餘空間不足
2018-07-03
boot
mysql閃回工具binlog2sql
2018-10-17
MySql
my2sql資料閃回
2024-10-16
SQL
SQL SERVER資料庫datediff函式引發的效能問題
2020-10-31
SQLServer資料庫函式
win10備份空間不足怎麼辦_win10備份空間不足如何處理
2020-02-11
Win10
Deepin v23安裝ArcGIS Server 10.8.1 for Linux報錯程式碼212可用空間不足的問題
2024-06-27
ServerLinux
在用迅為的4418開發板Flash空間問題求解
2019-05-13
伺服器空間不足怎麼辦
2022-07-07
伺服器
RDSforSQLserver空間問題排查彙總
2018-10-26
SQLServer
一次TiDB GC阻塞引發的效能問題分析
2022-12-20
TiDBGC
Mybatis PageHelper編譯SQL引發的一次效能問題.18286262
2024-07-05
MyBatis編譯SQL
oracle rac 打PSU補丁30805461兩個問題（Java版本及空間不足導致失敗）
2020-09-10
OracleJava
windows10磁碟空間不足怎麼清理_win10磁碟空間清理的方法
2019-12-27
WindowsWin10
區間問題的貪心方法
2020-12-03
ORA-19815: WARNING: db_recovery_file_dest_size閃回區爆滿問題處理
2021-10-24
Jenkins臨時空間不足處理辦法
2018-11-02
Jenkins
oracle dg庫資料檔案空間不足
2024-02-07
Oracle
雲伺服器空間不足如何解決？
2019-12-16
伺服器
SQLAlchemy in 查詢空列表問題分析
2019-02-16
SQL
Laravel MongoDB 時間區間查詢的問題
2020-04-10
LaravelMongoDB
記一次Java自動拆箱引發的空指標問題
2024-09-10
Java指標
MySQL工具之binlog2sql閃回操作
2019-07-23
MySql
恆訊科技講解：空間不足，香港雲伺服器怎麼加空間？
2021-10-09
伺服器
MySQL閃回技術之binlog2sql恢復binlog中的SQL
2019-12-06
MySql
[20211221]分析sql語句遇到的問題.txt
2021-12-22
SQL
【資料庫資料恢復】SQL Server資料庫磁碟空間不足的資料恢復案例
2022-07-27
資料庫資料恢復SQLServer
【資料庫資料恢復】磁碟空間不足導致sql server錯誤的資料恢復
2022-06-15
資料庫資料恢復SQLServer
MySQL 執行 Online DDL 操作報錯空間不足？
2024-02-20
MySql
如何解決Linux磁碟空間過大或不足?
2024-03-13
Linux
oracle表空間不足：ORA-01653: unable to extend table
2019-10-14
Oracle

閃回區空間不足引發的SQL問題分析

相關文章