md5sum命令用於生成檔案的md5數字摘要,並可以驗證檔案內容是否發生了改變,間接地還可以檢驗兩個檔案內容是否完全相同。因為md5sum是讀取檔案內容來計算校驗碼的,因此只能驗證檔案內容,而無法驗證檔案屬性。
[root@xuexi ~]# cp -a /etc/fstab /tmp/fstab
[root@xuexi ~]# cp -a /etc/fstab /tmp/fstab1
生成檔案的md5值。
[root@xuexi ~]# md5sum /tmp/fstab /tmp/fstab1
a612cd5d162e4620b442b0ff3474bf98 /tmp/fstab
a612cd5d162e4620b442b0ff3474bf98 /tmp/fstab1
發現這兩個檔案md5值完全一樣,也就說明這兩個檔案完全相同。
由於生成的md5資訊中,每個md5值後都緊跟著對應的檔案的路徑(可能是相對路徑),於是將生成的md5儲存到某個檔案中,以後可以使用該檔案來檢查md5值對應檔案內容是否發生了修改。
例如,將上述兩個檔案的md5資訊儲存到fs.md5sum中,然後使用"md5sum -c"可以檢查原始檔是否完整或是否被修改過。這個檢查是內容上的,許可權和屬性等的改變不會影響md5值,所以不會檢測出問題。
[root@xuexi ~]# md5sum /tmp/fstab /tmp/fstab1 >/tmp/fs.md5sum
[root@xuexi ~]# md5sum -c /tmp/fs.md5sum /tmp/fstab: OK /tmp/fstab1: OK
修改/tmp/fstab1的內容,然後再檢測。
[root@xuexi tmp]# echo aaa >>/tmp/fstab1
[root@xuexi tmp]# md5sum -c /tmp/fs.md5sum /tmp/fstab: OK /tmp/fstab1: FAILED
md5sum: WARNING: 1 of 2 computed checksums did NOT match
當使用了"-c"選項時,還支援以下選項:
--quiet:不顯示驗證結果為OK的記錄
--status:完全不顯示任何資訊,只能通過命令的退出狀態碼判斷驗證結果是否有failed。只要有一條failed記錄,則狀態碼為1,否則為0。
[root@xuexi tmp]# md5sum --status -c /tmp/fs.md5sum
[root@xuexi tmp]# echo $? 1
通過比較md5sum的值,可以判斷出多個檔案的內容是否完全一致,但肉眼判斷並不方便,所以寫出指令碼批量判斷。指令碼見:shell指令碼示例:批量比較多個檔案的內容是否相同。
獲取字串的MD5值:
字串“hello”的MD5:
-
$ echo -n 'hello'|md5sum|cut -d ' ' -f1
-
得到的MD5值:
-
5d41402abc4b2a76b9719d911017c592
-
命令解釋:
md5sum: 顯示或檢查 MD5(128-bit) 校驗和,若沒有檔案選項,或者檔案處為"-",則從標準輸入讀取。
echo -n : 不列印換行符。
cut: cut用來從標準輸入或文字檔案中剪下列或域。剪下文字可以將之貼上到一個文字檔案。
-d 指定與空格和tab鍵不同的域分隔符。-f1 表示第一個域。參考這裡。
獲取檔案的MD5值:
-
$ md5sum linuxmint-12-gnome-dvd-32bit.iso|cut -d ' ' -f1
得到的MD5值:
ee3d6e2ca498bc7685b7f17cdb5f2eea
-
$ md5sum linuxmint-12-gnome-dvd-32bit.iso >linuxmint-12-gnome-dvd-32bit.md5
-
注意linuxmint-12-gnome-dvd-32bit.md5的內容是:
-
ef3d6e2ca498bc7685b7f17cdb5f2eea linuxmint-12-gnome-dvd-32bit.iso
-
把linuxmint-12-gnome-dvd-32bit和其驗證檔案
linuxmint-12-gnome-dvd-32bit.md5放到同一目錄下用下面的命令:
-
$ md5sum -c linuxmint-12-gnome-dvd-32bit.md5
-
如果校驗正確則輸出:
-
linuxmint-12-gnome-dvd-32bit.iso: 確定
-
如果校驗錯誤則輸出:
-
linuxmint-12-gnome-dvd-32bit.iso: 失敗
-
md5sum: 警告:1/1 生成的校驗和不匹配
命令解釋:
md5 -c: 從檔案中讀取MD5 的校驗值並予以檢查
Message Digest Algorithm MD5為電腦保安領域廣泛使用的一種雜湊函式,用以提供訊息的完整性保護。該演算法的檔案號為RFC 1321(R.Rivest,MIT Laboratory for Computer Science and RSA Data Security Inc. April 1992)
keywords:Hash,SHA,Ronald L. Rivest,MD5,IETF(Internet Engineering Task Force)
前言
在網路傳輸、裝置之間轉存、複製大檔案等時,可能會出現傳輸前後資料不一致的情況。這種情況在網路這種相對更不穩定的環境中,容易出現。那麼校驗檔案的完整性,也是勢在必行的。
使用說明
md5sum命令用於生成和校驗檔案的md5值。它會逐位對檔案的內容進行校驗。是檔案的內容,與檔名無關,也就是檔案內容相同,其md5值相同。md5值是一個128位的二進位制資料,轉換成16進位制則是32(128/4)位的進位制值。
md5校驗,有很小的概率不同的檔案生成的md5可能相同。比md5更安全的校驗演算法還有SHA*系列的。
在網路傳輸時,我們校驗原始檔獲得其md5sum,傳輸完畢後,校驗其目標檔案,並對比如果原始檔和目標檔案md5 一致的話,則表示檔案傳輸無異常。否則說明檔案在傳輸過程中未正確傳輸。
重要的選項:
-b 以二進位制模式讀入檔案內容
-t 以文字模式讀入檔案內容
-c 根據已生成的md5值,對現存檔案進行校驗
--status 校驗完成後,不生成錯誤或正確的提示資訊,可以通過命令的返回值來判斷。
使用舉例
生成檔案md5值
md5sum file
1: [root@master lianxi]# md5sum data
2: 0a6de444981b68d6a049053296491e49 data
使用通配對多個檔案進行md5
1: [root@master lianxi]# md5sum *
2: 0a6de444981b68d6a049053296491e49 data
3: 13df384c47dd2638fd923f60c40224c6 data2
md5sum校驗的是檔案內容,與檔名無關
相同內容的檔案的md5一樣。如下我先對檔案進行復制,然後對同內容不同名的檔案進行md5,md5值一樣
1: [root@master lianxi]# cp data data.bak
2: [root@master lianxi]# ls
3: data data.bak
4: [root@master lianxi]# md5sum *
5: 0a6de444981b68d6a049053296491e49 data
6: 0a6de444981b68d6a049053296491e49 data.bak
以文字模式或二進位制模式讀入檔案並對其進行校驗
-b 以二進位制模式讀入內容
-t 以文字模式讀入檔案內容進行校驗
雖然是不同的讀入模式,但是在進行求md5的時候,是一樣的,因為是逐位校驗的。
如下文字檔案,無論通過哪種模式讀取md5都一致。
1: [root@master lianxi]# file data
2: data: ASCII text
3: [root@master lianxi]# md5sum data
4: 0a6de444981b68d6a049053296491e49 data
5: [root@master lianxi]# md5sum -b data
6: 0a6de444981b68d6a049053296491e49 *data
7: [root@master lianxi]# md5sum -t data
8: 0a6de444981b68d6a049053296491e49 data
md5值重定向
將生成md5值重定向到指定的檔案,通常檔案的副檔名我們會命為.md5
1: [root@master lianxi]# md5sum data > data.md5
2: [root@master lianxi]# md5sum data
3: 0a6de444981b68d6a049053296491e49 data
4: [root@master lianxi]# cat data.md5
5: 0a6de444981b68d6a049053296491e49 data
將多個檔案的md5重定向到指定的檔案
每個檔案的md5生成為一行
1: [root@master lianxi]# ls
2: data data.bak data.md5 d.md5
3: [root@master lianxi]# md5sum data* > d.md5
4: [root@master lianxi]# cat d.md5
5: 0a6de444981b68d6a049053296491e49 data
6: 0a6de444981b68d6a049053296491e49 data.bak
7: 0bd94658869c53cdcdf35a0f7de93e01 data.md5
重定向追加
這裡新增檔案ls,單獨求其md5,將其md5追加到檔案中
1: [root@master lianxi]# cp /bin/ls .
2: [root@master lianxi]# ls
3: data data.bak data.md5 d.md5 ls
4: [root@master lianxi]# md5sum ls >> d.md5
5: [root@master lianxi]# cat d.md5
6: 0a6de444981b68d6a049053296491e49 data
7: 0a6de444981b68d6a049053296491e49 data.bak
8: 0bd94658869c53cdcdf35a0f7de93e01 data.md5
9: c6337b20f3c159544bff5cf622391f9e ls
md5校驗
-c選項來對檔案md5進行校驗。校驗時,根據已生成的md5來進行校驗。生成當前檔案的md5,並和之前已經生成的md5進行對比,如果一致,則返回OK,否則返回錯誤資訊
md5sum –c d.md5
1: [root@master lianxi]# md5sum -c d.md5
2: data: OK
3: data.bak: OK
4: data.md5: OK
5: ls: OK
修改檔案後,檔案md5變化
1: [root@master lianxi]# ls
2: data
3: [root@master lianxi]# md5sum data
4: 2360752c3368ca4f89169f5ecc06e383 data
5: [root@master lianxi]# md5sum data > data.md5
6: [root@master lianxi]# echo "lwg" >> data
7: [root@master lianxi]# md5sum data
8: 287d237083a42f09785daa46a5fa3afe data
9: [root@master lianxi]# md5sum -c data.md5
10: data: FAILED
11: md5sum: WARNING: 1 of 1 computed checksum did NOT match
--status,不顯示校驗資訊,以命令返回值來判斷
校驗一致返回0,不一致返回1
1: [root@master lianxi]# md5sum -c data.md5
2: data: FAILED
3: md5sum: WARNING: 1 of 1 computed checksum did NOT match
4: [root@master lianxi]# md5sum -c --status data.md5
5: [root@master lianxi]# echo $?
6: 1
多個檔案檔案校驗和grep連用
通過grep將正確的資訊過濾掉
1: [root@master lianxi]# md5sum -c ../value.md5
2: acpid: OK
3: acpid.1: OK
4: anaconda.log: OK
5: anaconda.syslog: OK
6: anaconda.xlog: OK
7: boot.log: OK
8: boot.log.1: OK
9: ...
10: ...
11: 省略中間部分
12: ...
13: ...
14: yum.log.2: OK
15: md5sum: WARNING: 1 of 56 computed checksums did NOT match
1: [root@master lianxi]# md5sum -c ../value.md5 | grep -v OK
2: md5sum: WARNING: 1 of 56 computed checksums did NOT match
3: cron.1: FAILED
特殊說明
1)md5sum 是校驗檔案內容,與檔名是否相同無關
2)md5sum值逐位校驗,所以檔案越大,校驗時間越長。
總結
通過md5sum來校驗生成檔案校驗碼,來發現檔案傳輸(網路傳輸、複製、本地不同裝置間的傳輸)異常造成的檔案內容不一致的情況。