解決linux刪除檔案後空間沒有釋放問題

caixingyun發表於2016-10-15

linux刪除檔案後沒有釋放空間

 

今天發現一臺伺服器的home空間滿了,於是要清空沒用的檔案,當我刪除檔案後,發現可用空間沒有變化

 

os:centos4.7


現象:

 

發現當前磁碟空間使用情況:

 

[root@ticketb ~]# df -h
Filesystem            Size  Used Avail Use% Mounted on
/dev/sda1             981M  203M  729M  22% /
none                   16G     0   16G   0% /dev/shm
/dev/sda9             2.9G   37M  2.7G   2% /tmp
/dev/sda7             4.9G  1.9G  2.7G  42% /usr
/dev/sda8             2.9G  145M  2.6G   6% /var
/dev/mapper/vghome-lvhome
                       20G   19G   11M 100% /home
/dev/mapper/vgoradata-lvoradata
                      144G   48G   90G  35% /u01/oradata
/dev/mapper/vgbackup-lvbackup
                      193G  7.8G  175G   5% /u01/backup


通過以下的命令找到沒用的檔案,然後刪除


[root@ticketb ~]# find /home/oracle/admin/dbticb/udump/ -name "dbticb_*.trc" -mtime +50 | xargs rm -rf

 

然後在檢視磁碟空間使用情況,發現沒有/home空間沒有變化

 

[root@ticketb ~]# df -h
Filesystem            Size  Used Avail Use% Mounted on
/dev/sda1             981M  203M  729M  22% /
none                   16G     0   16G   0% /dev/shm
/dev/sda9             2.9G   37M  2.7G   2% /tmp
/dev/sda7             4.9G  1.9G  2.7G  42% /usr
/dev/sda8             2.9G  145M  2.6G   6% /var
/dev/mapper/vghome-lvhome
                       20G   19G   11M 100% /home
/dev/mapper/vgoradata-lvoradata
                      144G   48G   90G  35% /u01/oradata
/dev/mapper/vgbackup-lvbackup
                      193G  7.8G  175G   5% /u01/backup

 

這個鬱悶啊,明明刪除檔案了,怎麼空間沒有被釋放啊,rm命令應該是直接刪除啊,在檢視下/home下還有什麼佔用空間

 

[root@ticketb ~]# du -h --max-depth=1  /home
16K     /home/lost+found
2.6G    /home/oracle
2.6G    /home

 

可這裡顯示空間已經釋放了啊,於是google下,

 

未釋放磁碟空間原因:

 

在Linux或者Unix系統中,通過rm或者檔案管理器刪除檔案將會從檔案系統的資料夾結構上解除連結(unlink).然而假設檔案是被
開啟的(有一個程式正在使用),那麼程式將仍然能夠讀取該檔案,磁碟空間也一直被佔用。而我刪除的是oracle的告警log檔案
刪除的時候檔案應該正在被使用

 

解決方法

 

首先獲得一個已經被刪除可是仍然被應用程式佔用的檔案列表,例如以下所看到的:


[root@ticketb ~]# lsof |grep deleted
oracle    12639  oracle    5w      REG              253,0         648     215907 /home/oracle/admin/dbticb/udump/dbticb_ora_12637.trc (deleted)
oracle    12639  oracle    6w      REG              253,0 16749822091     215748 /home/oracle/admin/dbticb/bdump/alert_dbticb.log (deleted)
oracle    12639  oracle    7u      REG              253,0           0      36282 /home/oracle/oracle/product/10.2.0/db_1/dbs/lkinstdbticb (deleted)
oracle    12639  oracle    8w      REG              253,0 16749822091     215748 /home/oracle/admin/dbticb/bdump/alert_dbticb.log (deleted)
oracle    12641  oracle    5w      REG              253,0         648     215907 /home/oracle/admin/dbticb/udump/dbticb_ora_12637.trc (deleted)
oracle    12641  oracle    6w      REG              253,0 16749822091     215748 /home/oracle/admin/dbticb/bdump/alert_dbticb.log (deleted)



oracle    23492  oracle    6w      REG              253,0 16749822091     215748 /home/oracle/admin/dbticb/bdump/alert_dbticb.log (deleted)
oracle    23492  oracle    7u      REG              253,0           0      36282 /home/oracle/oracle/product/10.2.0/db_1/dbs/lkinstdbticb (deleted)
oracle    23492  oracle    8w      REG              253,0 16749822091     215748 /home/oracle/admin/dbticb/bdump/alert_dbticb.log (deleted)
oracle    23494  oracle   10u      REG              253,0           0      36307 /home/oracle/oracle/product/10.2.0/db_1/dbs/lkinstrmandb (deleted)

 


從輸出結果能夠看到/home/oracle/admin/dbticb/bdump/alert_dbticb.log還被使用,未被釋放空間

 

怎樣讓程式釋放呢?

 

一種方法是kill掉相應的程式,或者停掉使用這個檔案的應用,讓os自己主動回收磁碟空間

我這個環境有非常多程式在使用的這個檔案,停掉程式有點麻煩,再有就是風險非常大

 

當linux開啟一個檔案的時候,Linux核心會為每個程式在/proc/ 『/proc/nnnn/fd/資料夾(nnnn為pid)』建立一個以其pid
為名的資料夾用來儲存程式的相關資訊,而其子資料夾fd儲存的是該程式開啟的全部檔案的fd(fd:file descriptor)。

kill程式是通過截斷proc檔案系統中的檔案能夠強制要求系統回收分配給正在使用的的檔案。
這是一項高階技術,僅到管理員確定不會對執行中的程式造成影響時使用。應用程式對這樣的方
式支援的並不好,當一個正在使用的檔案被截斷可能會引發不可預知的問題

 

所以我還是採用停應用來解決

 

restart oracle資料庫,發現/home/oracle/admin/dbticb/bdump/alert_dbticb.log相應的空間被釋放

 

在檢視磁碟空間的使用情況,發現空間已經回收了


[root@ticketb ~]# df -h
Filesystem            Size  Used Avail Use% Mounted on
/dev/sda1             981M  203M  729M  22% /
none                   16G     0   16G   0% /dev/shm
/dev/sda9             2.9G   37M  2.7G   2% /tmp
/dev/sda7             4.9G  1.9G  2.7G  42% /usr
/dev/sda8             2.9G  145M  2.6G   6% /var
/dev/mapper/vghome-lvhome
                       20G  2.6G   16G  15% /home
/dev/mapper/vgoradata-lvoradata
                      144G   48G   90G  35% /u01/oradata
/dev/mapper/vgbackup-lvbackup
                      193G  7.8G  175G   5% /u01/backup


ok,問題解決,然後做下收尾工作就可以

 

-------------------------------------------------------------------------------------------------

 

學習下lsof命令

 

lsof全名list opened files,也就是列舉系統中已經被開啟的檔案。我們都知道,linux環境中,不論什麼事物都是檔案,
裝置是檔案,資料夾是檔案,甚至sockets也是檔案。所以,用好lsof命令,對日常的linux管理非常有幫助。

 

lsof是linux最常常使用的命令之中的一個,通常的輸出格式為:

 

引用
COMMAND     PID   USER   FD      TYPE     DEVICE     SIZE       NODE NAME

 

常見包含例如以下幾個欄位:許多其他的可見manual。

1、COMMAND
預設以9個字元長度顯示的命令名稱。可使用+c引數指定顯示的寬度,若+c後跟的引數為零,則顯示命令的全名
2、PID:程式的ID號
3、PPID
父程式的IP號,預設不顯示,當使用-R引數可開啟。
4、PGID
程式組的ID編號,預設也不會顯示,當使用-g引數時可開啟。
5、USER
命令的執行UID或系統中登陸的username稱。預設顯示為username,當使用-l引數時,可顯示UID。
6、FD
是檔案的File Descriptor number,或者例如以下的內容:
(這裡非常難翻譯相應的意思,保留英文)

 

引用
cwd  current working directory;
Lnn  library references (AIX);
jld  jail directory (FreeBSD);
ltx  shared library text (code and data);
Mxx  hex memory-mapped type number xx.
m86  DOS Merge mapped file;
mem  memory-mapped file;
mmap memory-mapped device;
pd   parent directory;
rtd  root directory;
tr   kernel trace file (OpenBSD);
txt  program text (code and data);
v86  VP/ix mapped file;

 

 

檔案的File Descriptor number顯示模式有:

 

引用
r for read access;
w for write access;
u for read and write access;
N for a Solaris NFS lock of unknown type;
r for read lock on part of the file;
R for a read lock on the entire file;
w for a write lock on part of the file;
W for a write lock on the entire file;
u for a read and write lock of any length;
U for a lock of unknown type;
x for an SCO OpenServer Xenix lock on part  of the file;
X  for an SCO OpenServer Xenix lock on the entire file;
space if there is no lock.

 

 

7、TYPE

引用
IPv4 IPv4的包;
IPv6 使用IPv6格式的包,即使地址是IPv4的,也會顯示為IPv6,而對映到IPv6的地址;
DIR 資料夾
LINK 連結檔案

詳情請看manual中許多其他的凝視。

 

8、DEVICE
使用character special、block special表示的裝置號
9、SIZE
檔案的大小,假設不能用大小表示的,會留空。使用-s引數控制。
10、NODE
本地檔案的node碼,或者協議,如TCP等
11、NAME
掛載點和檔案的全路徑(連結會被解析為實際路徑),或者連線兩方的地址和埠、狀態等

 

常常使用演示例子:

 

1.顯示開啟檔案/home/oracle/10.2.0/db_1/bin/tnslsnr的程式

 

[root@svr-db-test ~]# lsof /home/oracle/10.2.0/db_1/bin/tnslsnr
COMMAND  PID   USER  FD   TYPE DEVICE   SIZE     NODE NAME
tnslsnr 3520 oracle txt    REG  253,5 431062 11408866 /home/oracle/10.2.0/db_1/bin/tnslsnr

 

2.知道22埠如今執行什麼程式

 

[root@svr-db-test ~]# lsof -i :22
COMMAND  PID USER   FD   TYPE  DEVICE SIZE NODE NAME
sshd    3101 root    3u  IPv6    8670       TCP *:ssh (LISTEN)
sshd    4545 root    3u  IPv6 4237972       TCP 203.aibo.com:ssh->win-avbmq9e8ka7.gdgg.local:nsjtp-ctrl (ESTABLISHED)

 

3.顯示init程式如今開啟的檔案

 

[root@svr-db-test ~]# lsof -c init
COMMAND PID USER   FD   TYPE DEVICE    SIZE   NODE NAME
init      1 root  cwd    DIR  253,0    4096      2 /
init      1 root  rtd    DIR  253,0    4096      2 /
init      1 root  txt    REG  253,0   43496 524446 /sbin/init
init      1 root  mem    REG  253,0  130448 917826 /lib64/ld-2.5.so
init      1 root  mem    REG  253,0 1678480 917827 /lib64/libc-2.5.so
init      1 root  mem    REG  253,0   23520 917686 /lib64/libdl-2.5.so
init      1 root  mem    REG  253,0  247528 917844 /lib64/libsepol.so.1
init      1 root  mem    REG  253,0   95480 917845 /lib64/libselinux.so.1
init      1 root   10u  FIFO   0,16           2311 /dev/initctl

 

4. 看程式號為1的程式開啟了哪些檔案

 

[root@svr-db-test ~]# lsof -p 1
COMMAND PID USER   FD   TYPE DEVICE    SIZE   NODE NAME
init      1 root  cwd    DIR  253,0    4096      2 /
init      1 root  rtd    DIR  253,0    4096      2 /
init      1 root  txt    REG  253,0   43496 524446 /sbin/init
init      1 root  mem    REG  253,0  130448 917826 /lib64/ld-2.5.so
init      1 root  mem    REG  253,0 1678480 917827 /lib64/libc-2.5.so
init      1 root  mem    REG  253,0   23520 917686 /lib64/libdl-2.5.so
init      1 root  mem    REG  253,0  247528 917844 /lib64/libsepol.so.1
init      1 root  mem    REG  253,0   95480 917845 /lib64/libselinux.so.1
init      1 root   10u  FIFO   0,16           2311 /dev/initctl

 

5. 顯示歸屬3520的程式情況

 

[root@svr-db-test ~]# lsof -g 3520
COMMAND  PID PGID   USER   FD   TYPE             DEVICE      SIZE     NODE NAME
tnslsnr 3520 3520 oracle  cwd    DIR              253,5      4096 11059201 /home/oracle
tnslsnr 3520 3520 oracle  rtd    DIR              253,0      4096        2 /
tnslsnr 3520 3520 oracle  txt    REG              253,5    431062 11408866 /home/oracle/10.2.0/db_1/bin/tnslsnr
tnslsnr 3520 3520 oracle  mem    REG              253,0    130448   917826 /lib64/ld-2.5.so
tnslsnr 3520 3520 oracle  mem    REG              253,0   1678480   917827 /lib64/libc-2.5.so
tnslsnr 3520 3520 oracle  mem    REG              253,0     23520   917686 /lib64/libdl-2.5.so
tnslsnr 3520 3520 oracle  mem    REG              253,0    615136   917834 /lib64/libm-2.5.so
tnslsnr 3520 3520 oracle  mem    REG              253,0    141208   917829 /lib64/libpthread-2.5.so
tnslsnr 3520 3520 oracle  mem    REG              253,0    109824   917839 /lib64/libnsl-2.5.so
tnslsnr 3520 3520 oracle  mem    REG              253,5  20706622 11405436 /home/oracle/10.2.0/db_1/lib/libclntsh.so.10.1
tnslsnr 3520 3520 oracle  mem    REG              253,5   3803097 11410641 /home/oracle/10.2.0/db_1/lib/libnnz10.so
tnslsnr 3520 3520 oracle  mem    REG              253,5     83493 11407251 /home/oracle/10.2.0/db_1/lib/libons.so
tnslsnr 3520 3520 oracle  mem    REG              253,0     53880   917532 /lib64/libnss_files-2.5.so
tnslsnr 3520 3520 oracle  mem    REG              253,5      8545 11407615 /home/oracle/10.2.0/db_1/lib/libskgxn2.so
tnslsnr 3520 3520 oracle  mem    REG              253,5    513705 11410332 /home/oracle/10.2.0/db_1/lib/libocrutl10.so
tnslsnr 3520 3520 oracle  mem    REG              253,5    636161 11410330 /home/oracle/10.2.0/db_1/lib/libocr10.so
tnslsnr 3520 3520 oracle  mem    REG              253,5    657825 11410331 /home/oracle/10.2.0/db_1/lib/libocrb10.so
tnslsnr 3520 3520 oracle  mem    REG              253,5   1745769 11410365 /home/oracle/10.2.0/db_1/lib/libhasgen10.so
tnslsnr 3520 3520 oracle  mem    REG              253,5     61985 11410366 /home/oracle/10.2.0/db_1/lib/libclsra10.so
tnslsnr 3520 3520 oracle    0u   CHR                1,3               2553 /dev/null
tnslsnr 3520 3520 oracle    1u   CHR                1,3               2553 /dev/null
tnslsnr 3520 3520 oracle    2u   CHR                1,3               2553 /dev/null
tnslsnr 3520 3520 oracle    3w   REG              253,5 318853012 11633459 /home/oracle/10.2.0/db_1/network/log/listener.log
tnslsnr 3520 3520 oracle    4r  FIFO                0,6              15661 pipe
tnslsnr 3520 3520 oracle    5r   REG              253,5     11776 11410579 /home/oracle/10.2.0/db_1/network/mesg/nlus.msb
tnslsnr 3520 3520 oracle    6r   REG              253,5     46592 11407160 /home/oracle/10.2.0/db_1/network/mesg/tnsus.msb
tnslsnr 3520 3520 oracle    7w  FIFO                0,6              15662 pipe
tnslsnr 3520 3520 oracle    8u  IPv4              15665                TCP 203.aibo.com:ncube-lm (LISTEN)
tnslsnr 3520 3520 oracle    9u  unix 0xffff81021b7d6980              15666 /var/tmp/.oracle/s#3520.1
tnslsnr 3520 3520 oracle   10u  unix 0xffff81021b7d66c0              15668 /var/tmp/.oracle/s#3520.2


6.按照資料夾/home/oracle來搜尋,但不會開啟子資料夾,用來顯示資料夾下被程式開啟的檔案

 

[root@svr-db-test ~]# lsof +d /home/oracle
COMMAND  PID   USER   FD   TYPE DEVICE SIZE     NODE NAME
tnslsnr 3520 oracle  cwd    DIR  253,5 4096 11059201 /home/oracle

 

7. 開啟/home/oracle資料夾以及其子資料夾搜尋,用來顯示資料夾下被程式開啟的檔案

 

[root@svr-db-test ~]# lsof +D /home/oracle


顯示內容太多了,不顯示了


8. lsof -i 用以顯示符合條件的程式情況

 

語法: lsof -i[46] [protocol][@hostname|hostaddr][:service|port]

 

46 --> IPv4 or IPv6

protocol --> TCP or UDP

hostname --> Internet host name

hostaddr --> IPv4位置

service --> /etc/service中的 service name (能夠不僅僅一個)

port --> 埠號 (能夠不僅僅一個)

 

例:


[root@svr-db-test ~]# lsof -i tcp@192.168.2.245:1521 -n
COMMAND   PID   USER   FD   TYPE  DEVICE SIZE NODE NAME
oracle  15633 oracle   16u  IPv4 4069605       TCP 192.168.2.203:31580->192.168.2.245:ncube-lm (ESTABLISHED)

 

 

[root@svr-db-test ~]# lsof -i tcp@192.168.2.245:1521 
COMMAND   PID   USER   FD   TYPE  DEVICE SIZE NODE NAME
oracle  15633 oracle   16u  IPv4 4069605       TCP 203.aibo.com:31580->192.168.2.245:ncube-lm (ESTABLISHED)

 

lsof -n 不將IP轉換為hostname,預設是不加上-n引數

 

9. 顯示某使用者的已經開啟的檔案(或該使用者執行程式已經開啟的檔案)

 

[root@svr-db-test ~]# lsof -u oracle

[root@svr-db-test ~]# lsof -u 0


10. 僅列印程式,方便shell指令碼呼叫

[root@svr-db-test ~]# lsof -tc sshd
3101
4545

 

 

關注:

 

程式除錯命令:truss、strace和ltrace

 

程式無法啟動,軟體執行速度突然變慢,程式的"SegmentFault"等等都是讓每個Unix系統使用者頭痛的問題,而這些問題都能夠通過使用truss、strace和ltrace這三個常常使用的除錯工具來高速診斷軟體的"疑難雜症"。

相關文章