比較罕見的一個問題,磁碟檔案數目太多導致的LISTENER監聽起不來
問題提出:
一臺測試的伺服器,停電再起來後發現listener起不來,報錯如下:
Listening on: (DESCRIPTION=(ADDRESS=(PROTOCOL=tcp)(HOST=192.168.191.100)(PORT=1521)))
Error listening on: (ADDRESS=(PROTOCOL=ipc)(PARTIAL=yes)(QUEUESIZE=1))
No longer listening on: (DESCRIPTION=(ADDRESS=(PROTOCOL=tcp)(HOST=192.168.191.100)(PORT=1521)))
TNS-12549: TNSperating system resource quota exceeded
TNS-12560: TNSrotocol adapter error
TNS-00519: Operating system resource quota exceeded
Linux Error: 28: No space left on device
首先檢視log檔案,已經2G了,開啟看看日誌裡面也沒發現什麼異常,認為日誌是自然增長到這麼大的,於是直接cat /dev/null>listener.log把日誌清空。然後listener還是起不來,仍然報上面的錯誤。之後重啟機器,還是不行,檢查磁碟空間:
admin]$ df -h
Filesystem Size Used Avail Use% Mounted on
/dev/sdb2 4.9G 1.9G 2.7G 42% /
/dev/sdb1 99M 15M 79M 16% /boot
/dev/sdb7 1012M 493M 468M 52% /home
/dev/sdb8 61G 41G 18G 71% /opt
none 1000M 0 1000M 0% /dev/shm
/dev/sdb5 2.0G 33M 1.9G 2% /tmp
/dev/sdb6 1012M 606M 355M 64% /var
/dev/sda1 34G 14G 19G 43% /
oracle安裝在/opt目錄,上面還有18個G的空間,而且每個磁碟空間都很多。檢視process限制,top發現系統才開了50個process,而對oracle的限制是2048個。在pub的發帖,地址如下:
http://www.itpub.net/showthread.php?s=&threadid=809058&perpage=10&pagenumber=1
一直沒有解決,後來通知同事有這個問題存在。週一上班,同事說這個問題已經被他解決了,並推薦一篇文章給我,地址如下:
摘錄一部分:
Linux/Unix like OS 的檔案系統中每個目錄樹中的節點並不是像 Windows 那樣直接包含檔案的具體資訊,而只包含了檔名和 Inode number 。透過 Inode number 所找到對應於檔名的 Inode 節點中才真正記錄了檔案的大小/實體地址/所有者/訪問許可權/時間戳/被硬連結的次數等實際的 metadata 。因此你可以在 Linux 系統中透過硬連結( hard link ) 的方式給某個檔案建立無數個位於不同目錄下的檔名,而實際的檔案資料只需要一份複製。但也正因為這種檔案系統的結構,當你在 Linux 中進行 IO 操作的時候,需要的資源除了磁碟空間以外,還要有剩餘的 Inode 才行。預設情況下, Linux 在系統安裝過程中按照1個 Inode 對應 2k 磁碟空間來計算每個分割槽的最大 Inode 數。一旦檔案系統建立之後,每個分割槽可用 Inode 數就無法進行動態調整。正常來說,一般不太會出現某個分割槽的 Inode 耗盡而磁碟空間尚餘的情況,除非像我碰到的這樣垃圾小檔案瘋長而又沒進行有效的清理。但如果確實需要的話,可以在建立檔案系統(比如用 mke2fs )的時候根據實際需要來調整這個引數(比如分割槽如果用於存放超大影片檔案的話 Inode 的數量可以少一些;如果打算存放的檔案是大量小於 2k 的迷你檔案的話就要考慮多建立一些 Inode)。
使用df -i命令可以看到每個分割槽的總inode數目和被使用的以及空閒的inode數目:
[root@test-db1 log]# df -i
Filesystem Inodes IUsed IFree IUse% Mounted on
/dev/sdb2 640000 115018 524982 18% /
/dev/sdb1 26104 40 26064 1% /boot
/dev/sdb7 131616 409 131207 1% /home
/dev/sdb8 8077312 168316 7908996 3% /opt
none 255900 1 255899 1% /dev/shm
/dev/sdb5 262144 182 261962 1% /tmp
/dev/sdb6 131616 1500 130116 2% /var
/dev/sda1 4447744 117 4447627 1% /u01
上面的結果是同事已經處理後的結果,原因是/var的一個子目錄下產生很多很小的檔案,刪除後恢復正常,listener可以正常起來了。
繼續做下面一個試驗:
首先找到一個大小為200多k的測試檔案
[root@localhost test]# ll
total 208
-rw-r--r-- 1 root root 206305 Mar 8 10:28 test.log
然後檢視/usr的inode使用情況
[root@localhost test]# df -i
Filesystem Inodes IUsed IFree IUse% Mounted on
/dev/sda6 525888 98096 427792 19% /usr
然後把test.log分割成每個位元組一個檔案,split的使用方法可以參考:http://zhang41082.itpub.net/post/7167/289531
[root@localhost test]# split -a 10 -b 1 test.log
統計分割後的總檔案數目,比test.log的檔案大小206305多了兩個,這個一個是因為test.log檔案本身佔一個,還有就是統計的返回結果佔一行,所以看到檔案被成功分割為206305個。
[root@localhost test]# ll | wc -l
206307
檢視inode使用情況
[root@localhost test]# df -i
Filesystem Inodes IUsed IFree IUse% Mounted on
/dev/sda6 525888 304401 221487 58% /usr
可以看到,inode增加了304401-98096=206305個。然後把test.log重新命名為test1.log,重新分裂
[root@localhost test]# split -a 10 -b 1 test1.log z
[root@localhost test]# ll|wc -l
412612
[root@localhost test]# df -i
Filesystem Inodes IUsed IFree IUse% Mounted on
/dev/sda6 525888 510706 15182 98% /usr
inode已經使用了98%了,再重複一次
[root@localhost test]# mv test1.log test2.log
[root@localhost test]# split -a 10 -b 1 test2.log y
split: yaaaaaaawly: No space left on device
可以看到,進行到一半的時候已經不能對檔案再進行分割了,而錯誤提示也已經出現 No space left on device。
總結:這類錯誤是比較少見的錯誤,有時候oracle的bug或者其他原因會導致某個目錄的trace檔案數目瘋長,這時候就要小心這個問題了,因此日常的系統監控除了要監控磁碟空間的大小,對inode的使用情況也應該進行監控。
從這個問題可以看出,作業系統的知識多麼重要,感謝zeal的文章,感謝同事提供了這篇文章。
後續和補充:
今天看到pub上eygle給出了更合理的解釋,放在這裡作為補充。
為什麼/var目錄的inode滿了會影響到裝在/opt目錄的oracle不能啟動呢?原來listener啟動的時候會在/var/tmp目錄下的.oracle隱藏目錄下建立兩個臨時檔案:
[oracle@stream .oracle]$ ll
total 0
srwxrwxrwx 1 oracle oinstall 0 Feb 5 05:49 s#4036.1
srwxrwxrwx 1 oracle oinstall 0 Feb 5 05:49 s#4036.2
srwxrwxrwx 1 oracle oinstall 0 Apr 20 04:26 s#5332.1
srwxrwxrwx 1 oracle oinstall 0 Apr 20 04:26 s#5332.2
srwxrwxrwx 1 oracle oinstall 0 Jan 22 21:53 s#7306.1
srwxrwxrwx 1 oracle oinstall 0 Jan 22 21:53 s#7306.2
srwxrwxrwx 1 oracle oinstall 0 Jan 13 04:21 s#9611.1
srwxrwxrwx 1 oracle oinstall 0 Jan 13 04:21 s#9611.2
可以看到這個臨時檔案確實是成對出現的。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/25016/viewspace-925426/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 導致 Scan VIP 和 Scan Listener(監聽程式)出現故障的最常見的 5 個問題
- AIX maxperm引數導致監聽問題AI
- oracle listener 監聽啟動不起來處理案例一則Oracle
- 一個拷貝操作導致的潛在監聽類問題
- TNS監聽起不來的原因分析
- Oracle監聽日誌過大導致的問題Oracle
- /tmp檔案系統無許可權導致監聽listener啟動失敗
- 【監聽】listener.ora檔案理解
- PLSQL不規範的引數命名導致的問題SQL
- WPF 已知問題 監聽 WMI 事件導致觸控失效事件
- Oracle LISTENER監聽檔案引數詳解及Lsnrctl命令綜述Oracle
- 【LISTENER】修改監聽密碼導致NL-00051錯誤的分析與總結密碼
- 關於vue事件監聽的一個問題Vue事件
- 一個Oracle監聽問題的網路排查Oracle
- 請問在JAVA WEB專案中一個比較棘手的問題JavaWeb
- start_udev導致監聽自動停止問題處理dev
- 一個簡單的MySQL引數導致的連線問題解惑MySql
- ASM磁碟組故障導致資料庫不能起來ASM資料庫
- 一個字串比較的題字串
- 關於RAC中的監聽log檔案listener.log 及listener_rac01.log
- 2.5.2. 監聽程式(listener)配置——2.5.2.3. 手工編輯監聽器配置檔案
- ORACLE監聽器 The listener supports no services 問題解決方法Oracle
- Web中的監聽器【Listener】Web
- Docker啟動出現"No space left on device" 或者 docker日誌太多導致磁碟佔滿問題Dockerdev
- 解決 Laravel 專案中使用 NPM 監聽程式碼改動導致 IDE 卡死的問題LaravelNPMIDE
- Windows XP自帶的一個罕見的功能!Windows
- linux 111 錯誤 監聽起不來Linux
- oracle listener 靜態監聽與動態監聽的一些小事Oracle
- Oracle 三個監聽檔案Oracle
- oracle的監聽問題Oracle
- 【LISTENER】一個資料庫配置兩個監聽埠號資料庫
- 【LISTENER】配置靜態監聽時謹防SID_NAME大小寫問題導致資料庫無法連線資料庫
- rac 本地監聽問題導致資料斷斷續續連線
- 專案管理的一個案例,聽聽大家的意見專案管理
- WPF App後臺檔案彈窗導致奇怪的問題APP
- dba工作一定要細心:由於不細心導致的一個小問題
- 一個有關多域名session的問題,比較棘手Session
- RAC因為localhost磁碟空間不夠導致has程式掛起localhost