理解Linux檔案系統之 inode

time~travel發表於2020-10-19

一、inode是什麼?

理解inode,要從檔案儲存說起。
  檔案儲存在硬碟上,硬碟的最小儲存單位叫做”扇區”(Sector)。每個扇區儲存512位元組(相當於0.5KB)。作業系統讀取硬碟的時候,不會一個個扇區地讀取,這樣效率太低,而是一次性連續讀取多個扇區,即一次性讀取一個”塊”(block)。這種由多個扇區組成的”塊”,是檔案存取的最小單位。”塊”的大小,最常見的是4KB,即連續八個 sector組成一個 block。檔案資料都儲存在”塊”中,那麼很顯然,我們還必須找到一個地方儲存檔案的元資訊,比如檔案的建立者、檔案的建立日期、檔案的大小等等。這種儲存檔案元資訊的區域就叫做inode,中文譯名為”索引節點”。每一個檔案都有對應的inode,裡面包含了與該檔案有關的一些資訊。

二、inode的內容

inode包含檔案的元資訊,具體來說有以下內容:

  • 檔案的位元組數
  • 檔案擁有者的User ID
  • 檔案的Group ID
  • 檔案的讀、寫、執行許可權
  • 檔案的時間戳,共有三個:ctime指inode上一次變動的時間,mtime指檔案內容上一次變動的時間,atime指檔案上一次開啟的時間。
  • 連結數,即有多少檔名指向這個inode
  • 檔案資料block的位置

可以用stat命令,檢視某個檔案的inode資訊:
在這裡插入圖片描述
總之,除了檔名以外的所有檔案資訊,都存在inode之中。至於為什麼沒有檔名,下文會有詳細解釋。

三、inode的大小

  inode也會消耗硬碟空間,所以硬碟格式化的時候,作業系統自動將硬碟分成兩個區域。一個是資料區,存放檔案資料另一個是inode區(inode table),存放inode所包含的資訊。每個inode節點的大小,一般是128位元組或256位元組。inode節點的總數,在格式化時就給定,一般是每1KB或每2KB就設定一個inode。假定在一塊1GB的硬碟中,每個inode節點的大小為128位元組,每1KB就設定一個inode,那麼inode table的大小就會達到128MB,佔整塊硬碟的12.8%。
  檢視每個硬碟分割槽的inode總數和已經使用的數量,可以使用df命令。

df -i

在這裡插入圖片描述
檢視每個inode節點的大小,可以用如下命令:

sudo dumpe2fs -h /dev/sda2 | grep "Inode size"

在這裡插入圖片描述
由於每個檔案都必須有一個inode,因此有可能發生inode已經用光,但是硬碟還未存滿的情況。這時,就無法在硬碟上建立新檔案。

四、inode號碼

每個inode都有一個號碼,作業系統用inode號碼來識別不同的檔案。
  這裡值得重複一遍,Unix/Linux系統內部不使用檔名,而使用inode號碼來識別檔案。對於系統來說,檔名只是inode號碼便於識別的別稱或者綽號。表面上,使用者通過檔名,開啟檔案。實際上,系統內部這個過程分成三步:首先,系統找到這個檔名對應的inode號碼;其次,通過inode號碼,獲取inode資訊;最後,根據inode資訊,找到檔案資料所在的block,讀出資料。
  使用ls -i命令,可以看到檔名對應的inode號碼:

ls -i test.txt

在這裡插入圖片描述

五、目錄檔案

Unix/Linux系統中,目錄(directory)也是一種檔案。開啟目錄,實際上就是開啟目錄檔案。
  目錄檔案的結構非常簡單,就是一系列目錄項(dirent)的列表。每個目錄項,由兩部分組成:所包含檔案的檔名,以及該檔名對應的inode號碼。
  ls命令只列出目錄檔案中的所有檔名:

ls /etc/

在這裡插入圖片描述
ls -i命令列出整個目錄檔案,即檔名和inode號碼:

ls -i /etc/

在這裡插入圖片描述
如果要檢視檔案的詳細資訊,就必須根據inode號碼,訪問inode節點,讀取資訊。ls -l命令列出檔案的詳細資訊。

ls -l /etc/

在這裡插入圖片描述
  理解了上面這些知識,就能理解目錄的許可權。目錄檔案的讀許可權(r)和寫許可權(w),都是針對目錄檔案本身。由於目錄檔案內只有檔名和inode號碼,所以如果只有讀許可權,只能獲取檔名,無法獲取其他資訊,因為其他資訊都儲存在inode節點中,而讀取inode節點內的資訊需要目錄檔案的執行許可權(x)

六、硬連結

  一般情況下,檔名和inode號碼是”一一對應”關係,每個inode號碼對應一個檔名。但是,Unix/Linux系統允許,多個檔名指向同一個inode號碼。這意味著,可以用不同的檔名訪問同樣的內容;對檔案內容進行修改,會影響到所有檔名;但是,刪除一個檔名,不影響另一個檔名的訪問。這種情況就被稱為==”硬連結”==(hard link)。
  ln命令可以建立硬連結:

ln 原始檔 目標檔案

在這裡插入圖片描述
  執行上面這條命令以後,原始檔與目標檔案的inode號碼相同,都指向同一個inode。inode資訊中有一項叫做”連結數”,記錄指向該inode的檔名總數,這時就會增加1。
  反過來,刪除一個檔名,就會使得inode節點中的”連結數”減1。當這個值減到0,表明沒有檔名指向這個inode,系統就會回收這個inode號碼,以及其所對應block區域。
  這裡順便說一下目錄檔案的”連結數”。建立目錄時,預設會生成兩個目錄項:”.”和”…”。前者的inode號碼就是當前目錄的inode號碼,等同於當前目錄的”硬連結”;後者的inode號碼就是當前目錄的父目錄的inode號碼,等同於父目錄的”硬連結”。所以,任何一個目錄的”硬連結”總數,總是等於2加上它的子目錄總數(含隱藏目錄)。

七、軟連結

  除了硬連結以外,還有一種特殊情況。
  檔案A和檔案B的inode號碼雖然不一樣,但是檔案A的內容是檔案B的路徑。讀取檔案A時,系統會自動將訪問者導向檔案B。因此,無論開啟哪一個檔案,最終讀取的都是檔案B。這時,檔案A就稱為檔案B的”軟連結”(soft link)或者”符號連結(symbolic link)。
  這意味著,檔案A依賴於檔案B而存在,如果刪除了檔案B,開啟檔案A就會報錯:”No such file or directory”。這是軟連結與硬連結最大的不同:檔案A指向檔案B的檔名,而不是檔案B的inode號碼,檔案B的inode”連結數”不會因此發生變化。
  ln -s命令可以建立軟連結。

ln -s 源文檔案或目錄 目標檔案或目錄

在這裡插入圖片描述

八、inode的特殊作用

由於inode號碼與檔名分離,這種機制導致了一些Unix/Linux系統特有的現象。
  1. 有時,檔名包含特殊字元,無法正常刪除。這時,直接刪除inode節點,就能起到刪除檔案的作用。
  2. 移動檔案或重新命名檔案,只是改變檔名,不影響inode號碼。
  3. 開啟一個檔案以後,系統就以inode號碼來識別這個檔案,不再考慮檔名。因此,通常來說,系統無法從inode號碼得知檔名。
  第3點使得軟體更新變得簡單,可以在不關閉軟體的情況下進行更新,不需要重啟。因為系統通過inode號碼,識別執行中的檔案,不通過檔名。更新的時候,新版檔案以同樣的檔名,生成一個新的inode,不會影響到執行中的檔案。等到下一次執行這個軟體的時候,檔名就自動指向新版檔案,舊版檔案的inode則被回收。

九、擴充軟硬連結

  1. 硬連結
      硬連結是通過索引節點進行的連結。在Linux中,多個檔案指向同一個索引節點是允許的,像這樣的連結就是硬連結。硬連結只能在同一檔案系統中的檔案之間進行連結,不能對目錄進行建立。如果刪除硬連結對應的原始檔,則硬連結檔案仍然存在,而且儲存了原有的內容,這樣可以起到防止因為誤操作而錯誤刪除檔案的作用。由於硬連結是有著相同 inode 號僅檔名不同的檔案,因此,刪除一個硬連結檔案並不影響其他有相同 inode 號的檔案。
  2. 軟連結
      軟連結(也叫符號連結)與硬連結不同,檔案使用者資料塊中存放的內容是另一檔案的路徑名的指向。軟連結就是一個普通檔案,只是資料塊內容有點特殊。軟連結可對檔案或目錄建立。
      軟連結主要應用於以下兩個方面:一是方便管理,例如可以把一個複雜路徑下的檔案連結到一個簡單路徑下方便使用者訪問;另一方面就是解決檔案系統磁碟空間不足的情況。例如某個檔案檔案系統空間已經用完了,但是現在必須在該檔案系統下建立一個新的目錄並儲存大量的檔案,那麼可以把另一個剩餘空間較多的檔案系統中的目錄連結到該檔案系統中,這樣就可以很好的解決空間不足問題。刪除軟連結並不影響被指向的檔案,但若被指向的原檔案被刪除,則相關軟連線就變成了死連結。

相關文章