硬碟寫到一半時斷電，檔案系統裡會發什麼？

發表於2017-02-22

【伯樂線上轉註：】本文源自知乎問答帖：《硬碟寫到一半斷電時檔案系統發生了什麼？》。原題主的問題補充：

斷電時檔案系統發生了什麼？硬碟又發生了什麼？下一次開機時寫到一半的檔案在系統層面還在嗎？在底層還在嗎？

更進一步的, 檔案系統如何保證事務性, 會不會存在某種極端情況導致例如最後幾個bit還沒寫完, 檔案系統卻認為它成功了的情況?

回答不限任何檔案系統，謝謝！

下面是「北極」的回覆分享，伯樂線上已獲授權：

斷電的一瞬間，很多事情是無法確定的：

1. 你無法確定你試圖向裝置驅動傳送的寫指令是否成功，驅動程式本身一般都有快取；

2. 即使寫指令正常返回，你也無法確定裝置實際上是否寫成功，因為裝置本身可能也有快取。目前沒有裝置能保證寫指令返回的情況下，所有資料一定成功的儲存在介質上（但部分廠商能保證少量資料一定能成功寫入），對儲存裝置的flush操作並非絕對可靠；

3. 哪些成功哪些失敗可能是亂序的，換句話說，如果先傳送寫請求A，再傳送寫請求B，並且都成功返回，掉電時請求A可能丟失，但B成功（NCQ功能）；

4. 機械式磁碟可能會出現丟失半截資料的情況（比如，一個512位元組扇區只寫入了100位元組，也就是題主說的bit級錯誤），但這種一般都會通過校驗位檢測出來。

因為有以上這麼多的限制，實際上檔案系統一般沒辦法保證資料一定不丟失，甚至哪些丟失哪些能恢復也是不確定的。

一般來說，檔案系統有以下的幾種策略：

1. 完全不管錯誤的事情，錯了就錯了；

2. 打標記位的方式，如果懷疑有錯，通過磁碟檢測功能恢復；

3. 在設計上保證檔案系統結構上可恢復，但不保證使用者資料可恢復；

4. 能在使用者資料層面上保證資料的絕對正確。

第一種和第二種策略現在比較少見，FAT檔案系統算是屬於這類；主流檔案系統基本上都能保證第三種，比如NTFS之類的；第四種比較難，一般都要配合儲存驅動一起，多見於Flash介質的專屬檔案系統。

保證資料不損壞，具體的方案一般有：

方案1：Copy-On-Write，寫資料的時候不在原來的位置寫，而是先讀一份，然後寫到另外一個位置，當確認寫成功時，把檔案系統的指標指向新的位置。如下圖：

硬碟寫到一半時斷電，檔案系統裡會發什麼？

實際應用中，比這個情況複雜，因為Data2寫入的過程中，File1本身的一些資訊（修改時間等）也發生了變化，所以CopyOnWrite產生的影響不止這一個塊，而是很多。

方案2：日誌（Journal）技術。使用日誌記錄meta-data甚至是資料塊的變化情況（NTFS就是這種策略），一旦出現掉電情況，在日誌中反推到一個正確的狀態上，就可以保證meta-data不損壞。

常見的方案就這兩種，當然還有別的更復雜的技術，可以參考這個連結（Comparison of file systems），但不管用什麼方案，本質上都是以犧牲效能為代價換取結構上的穩定。

最後回到題主的問題，檔案系統如何保證資料的正確性？如果是指檔案的資料部分，是無法保證的，因為檔案系統無法確定資料到底寫沒寫進去，絕大多數檔案系統只能保證自身結構是正確的，但這個正確可能是回滾之後的狀態，具體回滾多少內容，檔案系統自己也不能保證。

這事說起來挺複雜的，不同檔案系統，不同裝置，不同介質，效果都是有區別的。

檔案系統的設計一般是效能和資料完整性的妥協，如果你想要最高完整性，那麼效能會差一些，如果你想要最高效能，那麼資料完整性會差一些，僅此而已。當然這些都是針對資料而言的，對於檔案系統自身的後設資料，一般設計者為了自身資料完整性的考慮都會有日誌系統（比如ext4使用jbd2），從而儘量保證檔案系統在斷電時沒有問題或者問題很少（需要使用fsck來解決），但是使用者資料是否完備是由使用者選擇和配置的，而檔案系統會根據不同配置選擇不同的策略。

我們以Linux最通用的ext4為例，他有三種模式供使用者選擇data=writeback/ordered/journal，對應的是資料落盤的三種方式，writeback是指後設資料更新的時候資料不考慮是否落盤，所以掉電以後可能會看到一些亂七八糟的資料，ordered的意思是後設資料更新在資料更新之後（如果你沒有更改後設資料那就沒有辦法保證資料了），還有一種是journal意思是資料也先寫journal再寫檔案（double write）,這種資料安全性最高，當然效能也最差。詳細的介紹可以參加mount(8)。

說完檔案系統，我們再說硬碟，硬碟在檔案系統下面，所以檔案系統是重度依賴硬碟來實現資料完整性的，而硬碟也提供了一些命令來保障檔案系統資料完整性的語義。比如硬碟會提供flush命令，保證只要上層檔案系統呼叫了這個命令，那麼檔案系統之前寫到硬碟裡面的內容必須落盤了（一般的硬碟有記憶體cache，為了提高寫入效能會快取一部分資料，flush會命令硬碟將cache內容落盤。當然如果硬碟如果有電容可以保證cache即使掉電也會落盤，那麼他也可以欺騙上層的檔案系統 :) ），這樣檔案系統在寫入一些關鍵資料以後必須呼叫flush，在得到硬碟的flush反饋以後再進行後面的工作。當然現代硬碟還有一些FUA(Force Unit Access)之類的操作，這些是為了加速某類磁碟落盤的操作，本質上即使硬碟不提供檔案系統可以改成write+flush來實現（只是效能差一些），如果感興趣大家可以自行google之。

說完底層，還有一層要說一下，就是你的應用是怎麼寫檔案和硬碟的，如果是buffer write(應用只寫到作業系統的記憶體，由作業系統延遲迴寫到硬碟)，那麼很大可能你在掉電之前一段時間寫入的資料都會不見了（作業系統還沒有回寫），如果應用是direct IO(應用繞過作業系統記憶體，直接寫硬碟)，那麼可能只有掉電時刻正在寫入的資料不見了，當然這裡可能還涉及到direct IO的語義以及不同檔案系統的具體實現，和檔案系統相關，就需要具體問題具體分析了。

將ASM裡面的檔案copy到檔案系統
2017-01-19
ASM
電腦系統怎麼給硬碟分割槽管理檔案資料？
2021-11-10
硬碟
什麼是硬碟邏輯損壞和檔案系統錯誤
2024-07-17
硬碟
檔案傳輸中斷怎麼辦？對檔案會有什麼影響？
2020-09-17
為什麼當系統啟動到Sendmail時會暫停(轉)
2007-08-14
AI
MYSQL 什麼時候同步binlog檔案以及它的臨時檔案在哪裡？
2017-02-15
MySql
win10系統電腦hosts檔案位置在哪裡
2021-01-21
Win10
MySQL:為什麼lsof會看到這麼多臨時檔案
2020-10-28
MySql
win10系統怎麼掃描檔案 win10掃描檔案到電腦
2022-01-24
Win10
硬碟根目錄裡的Msdia80.dll檔案是幹什麼用的
2015-05-28
硬碟
為什麼 MySQL 裡的 ibdata1 檔案不斷的增長？
2015-07-16
MySql
系統為什麼會在執行時當機
2016-09-27
asm拷貝檔案到檔案系統
2013-12-18
ASM
vmware中增加硬碟掛載檔案系統
2015-01-24
硬碟
win10系統Hosts檔案在哪裡 win10系統怎麼開啟Hosts檔案
2019-09-18
Win10
沒有什麼，開發ASP.NET時隨便寫寫，想到什麼寫什麼
2021-09-09
ASP.NET
什麼是檔案包含漏洞?會造成什麼危害？
2022-09-20
這個遊戲檔案館裡有什麼？
2021-06-23
遊戲
ASM與檔案系統之間copy資料檔案--檔案系統到ASM
2014-03-06
ASM
Linux系統中tmp指什麼檔案?其作用是什麼？
2022-09-07
Linux
Linux中proc檔案系統是什麼意思？有什麼作用？
2023-04-24
Linux
在Linux中，檔案系統概念是什麼？
2024-06-09
Linux
怎麼清理temp資料夾的臨時檔案？Win7系統電腦temp臨時檔案的清理方法
2019-10-17
Win7
電腦突然斷電導致檔案丟失怎麼辦？
2015-04-01
win10系統用什麼檢視epub檔案_win10系統怎麼檢視epub檔案
2020-02-17
Win10
Python 不寫硬碟上傳檔案
2022-07-12
Python硬碟
從網路裡面獲取資料寫入到檔案
2011-12-10
轉 Ext2 檔案系統的硬碟佈局
2010-08-31
硬碟
Ext2 檔案系統的硬碟佈局(轉)
2007-08-10
硬碟
JS 裡為什麼會有 this
2017-12-14
JS
移動資料檔案從ASM到檔案系統
2011-09-16
ASM
如何遷移ASM資料檔案到檔案系統
2011-11-10
ASM
windows共享到linux系統檔案
2023-01-14
WindowsLinux
系統呼叫時為什麼發生任務切換？
2020-09-23
瞧瞧這個將CBitmap寫到Bmp檔案裡的函式 (轉)
2007-12-02
函式
mysql什麼時候會發生file sort
2022-03-09
MySql
用Python寫一個FUSE（使用者態檔案系統）檔案系統
2013-12-02
Python
javabean 如何打包到jar檔案裡
2004-10-03
JavaBeanJAR

硬碟寫到一半時斷電，檔案系統裡會發什麼？

下面是「北極」的回覆分享，伯樂線上已獲授權：

下面是「馬濤」的回答分享，伯樂線上已獲授權

相關文章