pwd命令的作用
Linux的檔案系統比較龐大,所以筆者從pwd這一命令入手,在實現的過程中加深對檔案系統的瞭解。
輸入:man pwd
從指導文件中可以看到,pwd命令的作用是顯示出當前所處位置,以路徑的形式列印出來。
舉例如下:
筆者首先輸入pwd命令,顯示出/home/lularible
,說明我當前就處在該位置。
當筆者進入其中的一個子目錄"bin"時,再次輸入pwd命令,顯示出/home/lularible/bin
,這是顯而易見的。
Linux檔案系統內部結構
為了能夠實現pwd命令,就需要先了解Linux檔案系統的內部結構
檔案系統的多層抽象
一般而言,檔案是儲存在硬碟上的,那麼將磁碟這一物理實體,進行邏輯劃分和組織,就是進行抽象的過程。目的就是為了便於管理。
最樸素的管理手段就是,給硬碟的區域編號,按照編號從低到高給檔案分配儲存空間。當然,訪問效率就可想而知了(當檔案數量一多,訪問效率將會及其低下)。所以那些系統開發人員就發揮出自己的聰明才智,對檔案系統進行了巧妙的設計。
第一層抽象:從磁碟到分割槽
一整塊磁碟,能儲存大量的資料,統一管理起來不太方便。若能將它分而治之,則更加靈活。比如說window系統裡面的磁碟分割槽:C盤,D盤,E盤等等。每個分割槽都可以看作是一個獨立的磁碟。
第二層抽象:從磁碟到塊序列
一個磁碟由一些磁性碟片組成。每個碟片的表面都被劃分為很多同心圓,這些同心圓稱作磁軌,每一個磁軌又進一步被劃分為扇區,每個扇區可以儲存一定位元組的資料(如512位元組)。扇區是磁碟上的基本儲存單元,每次空間分配或者訪問都是以一個扇區為最小單位。
第三層抽象:從塊序列到三個區域的劃分
為了儲存不同型別的資料(檔案內容、檔案屬性、目錄),將磁碟塊分為3個部分:
- 1.超級塊:檔案系統中的第一個塊被稱為超級塊,用來存放檔案系統本身的結構資訊。
- 2.i-節點表:檔案系統的下一個部分被稱為i-節點表。每個檔案都有一些屬性,如大小、檔案所有者和最近修改時間等。這些性質被記錄在一個稱為i-節點的結構中。所有的i-節點都有相同的大小,並且i-節點表是這些結構的一個列表。
- 3.資料區:檔案系統的第三部分是資料區。檔案的內容儲存在這個區域。
建立一個檔案的過程
檔案有內容和屬性,核心將檔案內容存放在資料區,檔案屬性存放在i-節點,檔名存放在目錄。下圖所示為建立一個檔案的例子:
其中的幾個主要操作為:
- 1.儲存屬性:核心找到一個空的i-節點(圖中為47),把檔案資訊記錄到該i-節點中。
- 2.儲存資料:核心從空閒磁碟塊表中獲得627、200、992這三個磁碟塊,將核心緩衝區中的資料複製到這三個磁碟塊中。
- 3.記錄分配情況:檔案內容按序存放在磁碟塊627/200/992中。核心在i-節點的磁碟分佈區記錄了上述序列塊。磁碟分佈區是一個磁碟塊序號的列表,這三個編號放在最開始的三個位置。
- 4.新增檔名到目錄:新檔案的名字是userlist。核心將入口(47,userlist)新增到目錄檔案。檔名和i-節點號之間的對應關係將檔名和檔案的內容及屬性連線了起來。
目錄的結構
目錄被抽象為一個包含i-節點號和檔名的表。
輸入ls -ia
可以檢視當前目錄包含的檔案以及對應的i-節點號:
如代表當前目錄的"."的i-節點號為1048600,代表上一級目錄的".."的i-節點號為936372。再看一下根目錄的組成:
其中"."和".."的i-節點號都是2,說明根目錄的上級目錄就是自己。另外,還可以看到存在i-節點號一樣的檔案(目錄),這就是硬連結,將在後續的軟、硬連結區別一節中敘述。
檔案讀取的工作原理
既然知道了目錄的結構,那麼就可以理一遍檔案讀取的過程了。舉例來說:
輸入cat userlist
,表示讀取userlist這個檔案並顯示。
step1.在目錄中尋找檔名
檔名儲存在目錄檔案中,核心在目錄檔案中尋找包含字串"userlist"的記錄。userlist所在的記錄包含編號為47的i-節點。
step2.定位i-節點並讀取內容
核心在檔案系統中的i-節點區域找到i-節點47。i-節點包含資料塊編號的列表。
step3.訪問儲存檔案內容的資料塊
在step2之後,即知道了資料塊的位置和在磁碟中的順序,就可以通過不停的呼叫read函式,使核心不斷將位元組從磁碟複製到核心緩衝區。
ps:讀取許可權的控制:核心根據檔名找到i-節點號,再根據i-節點號找到i-節點。在i-節點中,找到檔案的許可權位和使用者ID,從而判斷該使用者是否具有讀取許可權。
大檔案的i-節點
每個檔案對應一個i-節點,而每個i-節點大小是固定的,所以當檔案內容需要佔用很多磁碟塊時,i-節點中的磁碟分佈區可能不夠用。這個時候,就需要採用多級分配的方式。一圖說明問題:
其中,級數越多,訪問磁碟時就越慢。因為需要按照每一級的指引,多次讀取磁碟。
實現pwd
思路
- 1.獲得當前目錄的i-節點號,記為stat
- 2.改變目錄至上級目錄
- 3.找到i-節點號stat的名字
重複上述步驟,直到樹頂。到樹頂的判斷依據:一個目錄的"."和".."的i-節點號相同。
原始碼
#include<stdio.h>
#include<sys/types.h>
#include<sys/stat.h>
#include<dirent.h>
#include<stdlib.h>
#include<string.h>
#include<unistd.h>
ino_t get_inode(char*);
void printpathto(ino_t);
void inum_to_name(ino_t,char*,int);
int main()
{
printpathto(get_inode(".")); //列印當前位置(檔案路徑)
putchar('\n');
return 0;
}
void printpathto(ino_t this_inode)
{
ino_t my_inode;
char its_name[BUFSIZ];
if(get_inode("..") != this_inode)
{
chdir(".."); //往上一級
inum_to_name(this_inode,its_name,BUFSIZ); //獲得i-節點號對應的檔名
my_inode = get_inode("."); //獲得當前目錄節點號
printpathto(my_inode); //遞迴列印
printf("/%s",its_name); //列印檔名
}
}
//獲得i-節點號對應的檔名
void inum_to_name(ino_t inode_to_find,char* namebuf,int buflen)
{
DIR* dir_ptr;
struct dirent* direntp;
dir_ptr = opendir(".");
if(dir_ptr == NULL){
perror(".");
exit(1);
}
while((direntp = readdir(dir_ptr)) != NULL){
if(direntp->d_ino == inode_to_find){
strncpy(namebuf,direntp->d_name,buflen);
namebuf[buflen-1] = '\0';
closedir(dir_ptr);
return;
}
}
fprintf(stderr,"error looking for inum %ld\n",inode_to_find);
exit(1);
}
//獲得檔名對應的i-節點號
ino_t get_inode(char* fname)
{
struct stat info;
if(stat(fname,&info) == -1){
fprintf(stderr,"Cannot stat");
perror(fname);
exit(1);
}
return info.st_ino;
}
當pwd01命令執行在裝載檔案系統中時,可能會出現與原版pwd不同的結果。(裝載檔案系統是指將它嵌入到已有的系統以獲得某些支援,子樹的根目錄被嵌入到根檔案系統的一個目錄中,子樹所在的目錄被稱為第二個系統的裝載點。)依據pwd01命令的實現邏輯,當遇到當前目錄和上級目錄i-節點號一樣時,就停止上溯,實際上可能只是到達了一個被裝載的檔案系統的頂端,而非整個檔案系統的頂端。
硬連結和軟連結(符號連結)
假設多個檔名通過硬連結的方式指向同一個檔案,那麼它們擁有同一個i-節點,系統會記錄連結數。如果刪除其中的一個檔案,則會將連結數減一,直到連結數為0時,才會真正刪除檔案。
而建立原檔案的軟連結,則其i-節點號與原檔案的不同,並且連結數、修改時間和檔案大小都不同於原始檔案。若原始檔案被刪除或者位置變動或者被改名,那麼軟連結將指向空。這種思想有點類似於window中的快捷方式。
參考資料
《Understanding Unix/Linux Programming A Guide to Theory and Practice》
歡迎大家轉載本人的部落格(需註明出處),本人另外還有一個個人部落格網站:lularible的個人部落格,歡迎前去瀏覽。