Linux 日誌檔案系統如何工作
導讀 | 檔案系統要解決的一個關鍵問題是怎樣防止掉電或系統崩潰造成資料損壞,在此類意外事件中,導致檔案系統損壞的根本原因在於寫檔案不是原子操作,因為寫檔案涉及的不僅僅是使用者資料,還涉及後設資料(metadata)包括 Superblock、inode bitmap、inode、data block bitmap等,所以寫操作無法一步完成,如果其中任何一個步驟被打斷,就會造成資料的不一致或損壞。 |
舉一個簡化的例子,我們對一個檔案進行寫操作,要涉及以下步驟:
- 1.從data block bitmap中分配一個資料塊;
- 2.在inode中新增指向資料塊的指標;
- 3.把使用者資料寫入資料塊。
如果步驟2完成了,3未完成,結果是資料損壞,因為該檔案認為資料塊是自己的,但裡面的資料其實是垃圾;
如果步驟2完成了,1未完成,結果是後設資料不一致,因為該檔案已經把資料塊據為己有,然而檔案系統卻還認為該資料塊未分配、隨後又可能會把該資料塊分配給別的檔案、造成資料覆蓋;
如果步驟1完成了、2未完成,結果就是檔案系統分配了一個資料塊,但是沒有任何檔案用到這個資料塊,造成空間浪費;
如果步驟3完成了,2未完成,結果就是使用者資料寫入了硬碟資料塊中,但白寫了,因為檔案不知道這個資料塊是自己的。
日誌檔案系統(Journal File System)就是為解決上述問題而誕生的。
它的原理是在進行寫操作之前,把即將進行的各個步驟(稱為transaction)事先記錄下來,儲存在檔案系統上單獨開闢的一塊空間上,這就是所謂的日誌(journal),也被稱為write-ahead logging,日誌儲存成功之後才進行真正的寫操作、把檔案系統的後設資料和使用者資料寫進硬碟(稱為checkpoint),這樣萬一寫操作的過程中掉電,下次掛載檔案系統之前把儲存好的日誌重新執行一遍就行了(術語叫做replay),避免了前述的資料損壞場景。
有人問如果儲存日誌的過程中掉電怎麼辦?最初始的想法是把一條日誌的資料一次性寫入硬碟,相當於一個原子操作,然而這並不可行,因為硬碟通常以512位元組為單位進行操作,日誌資料一超過512位元組就不可能一次性寫入了。所以實際上是這麼做的:給每一條日誌設定一個結束符,只有在日誌寫入成功之後才寫結束符,如果一條日誌沒有對應的結束符就會被視為無效日誌,直接丟棄,這樣就保證了日誌裡的資料是完整的。
一條日誌在它對應的寫操作完成之後就沒用了,佔用的硬碟空間就可以釋放。儲存日誌的硬碟空間大小是有限的,被迴圈使用,所以日誌也被稱為circular log。
至此可以總結一下日誌檔案系統的工作步驟了:
- Journal write : 把transaction寫入日誌中;
- Journal commit : 在一條日誌儲存好之後,寫入結束符;
- Checkpoint : 進行真正的寫操作,把後設資料(metadata)和使用者資料(user data)寫入檔案系統;
- Free : 回收日誌佔用的硬碟空間。
以上方式把使用者資料(user data)也記錄在日誌中,稱為Data Journaling, EXT3檔案系統就支援這種方式,這種方式存在效率問題:
就是每一個寫操作涉及的後設資料(metadata)和使用者資料(user data)實際上都要在硬碟上寫兩次,一次寫在日誌裡,一次寫在檔案系統上。後設資料倒也罷了,使用者資料通常比較大,複製幾個GB的電影檔案也要乘以2實在是降低了效率。
一個更高效的方式是Metadata Journaling,不把使用者資料(user data)記錄在日誌中,它防止資料損壞的方法是先寫入使用者資料(user data)、再寫日誌,即在上述”Journal write”之前先寫使用者資料,這樣就保證了只要日誌是有效的,那麼它對應的使用者資料也是有效的,一旦發生掉電故障,最壞的結果也就是最後一條日誌沒記完,那麼對應的使用者資料也會丟,效果與Data Journaling丟棄日誌一樣,重要的是檔案系統的一致性和完整性是有保證的。
Metadata Journaling又叫Ordered Journaling,大多數檔案系統都採用這種方式。像Linux EXT3檔案系統也是可以選擇Data Journaling還是Ordered Journaling的。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69955379/viewspace-2766506/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- linux檔案系統和日誌分析Linux
- Linux檔案系統與日誌分析Linux
- 日誌檔案系統
- Linux--檔案系統與日誌分析Linux
- Linux日誌檔案系統及效能分析(轉)Linux
- Linux日誌式檔案系統面面觀(轉)Linux
- 在Linux中,有哪些系統日誌檔案?Linux
- Linux系統日誌分為哪幾種?日誌檔案包括幾列內容?Linux
- 日誌檔案和歸檔日誌檔案的關係以及如何切換日誌
- [轉]HP-UX系統日誌檔案UX
- linux的日誌檔案Linux
- Linux 檔案系統與日誌分析的相關知識Linux
- Linux 系統中使用 logwatch 監控日誌檔案Linux
- Linux系統級日誌系統Linux
- AIX日誌檔案系統(Journaled File System)管理AI
- linux日誌檔案說明Linux
- 在Linux中,如何檢視系統日誌?Linux
- 在Linux中,有一堆日誌檔案,如何刪除7天前的日誌檔案?Linux
- Linux日誌系統(一)Linux
- fedora 8上的系統日誌的配置檔案
- Linux系統常見的日誌檔案及優先順序別!Linux
- 【Oracle日誌】- 日誌檔案重建Oracle
- 日誌檔案
- 在Linux中,如何檢視和審計系統日誌檔案以檢測異常活動?Linux
- LINUX檢視系統日誌Linux
- MySQL資料庫中的日誌檔案---(5)系統日誌表的特點MySql資料庫
- 在Linux中,如何使用logrotate命令管理日誌檔案?Linuxlogrotate
- 在Linux中,如何管理和最佳化日誌檔案?Linux
- 檔案系統(六):一文看懂linux ext4檔案系統工作原理Linux
- 刪除日誌檔案組與日誌檔案成員
- 如何刪除SAP 系統日誌
- win10日誌檔案在哪裡_win10系統日誌怎麼檢視Win10
- 管理日誌檔案
- dump日誌檔案
- APACHE日誌檔案Apache
- Linux 系統日誌的組成Linux
- 檔案系統(八):Linux JFFS2檔案系統工作原理、優勢與侷限Linux
- 白皮書:Red Hat日誌檔案系統-ext3(轉)