詳解 MD5 資訊摘要演算法

xiaxveliang發表於2021-07-13

對於軟體研發人員來說 MD5 不是一個陌生的詞彙,平時的軟體研發中,經常使用 MD5 校驗訊息是否被篡改、驗證檔案完整性,甚至將MD5當作加密演算法使用。
MD5雖不陌生,但不是所有研發人員都瞭解其演算法原理,通過這篇文章詳細學習MD5 摘要演算法。

  • 認識 MD5
  • 掌握 MD5 演算法原理
  • 編碼實現 MD5 摘要演算法
    使用Java開發語言 編碼實現MD5摘要演算法。

一、認識MD5

MD5(Message Digest Algorithm 5)中文名為訊息摘要演算法第五版,是電腦保安領域廣泛使用的一種雜湊函式,用以提供訊息完整性保護

MD5作為一種常用的摘要演算法(或指紋演算法),其具有以下幾個重要的特點(個人觀點):

  • 輸入任意長度資訊,輸出長度固定:
    MD5 可輸入任意長度的資訊,其輸出均為128位(bit)固定長度的二進位制資料
  • 運算速度快:
    MD5的運算均為32位 與、或、非、位移等位運算,因此其運算速率快,幾乎不消耗CPU時間。
  • 不可逆:
    根據MD5的的雜湊結果無法計算原始資料(查字典除外)。
  • 碰撞性:
    原始資料與其MD5雜湊結果非一一對應,存在多個原始資料MD5結果相同的可能性
  • 不安全:
    2011年,RFC 6151 禁止MD5用作金鑰雜湊訊息認證碼。

1.1 長度

日常軟體研發中 MD5計算結果一般為長度為32的字串,偶爾也會遇到長度為16的字串。那麼,MD5到底是多長的字串?

MD5雜湊結果是128位(bit)固定長度的二進位制資料,也就是128個0/1的二進資料。
128位二進位制資料呈現MD5的雜湊結果,對於軟體開發者很不友好
一般將二進位制轉成16進位制,每4個二進位制資料轉化為一個16進位制資料128位二進位制資料轉化為32個十六進位制資料128/4 = 32),最終以字串形式呈現十六進位制資料後則為長度為32的字串

8位二進位制資料,轉化為2個十六進位制資料舉例如下:

// 8位二進位制 ——> 2個十六進位制資料
// 二進位制資料
0100 0101
// 對應的 十六制資料
4 5

為什麼網上還有16位MD5雜湊結果呢?

這裡以 Message Digest Algorithm 作為原始資料,分別計算其32位16位的雜湊結果:

// 32位雜湊結果
MD5(Message Digest Algorithm,32) = e4b0190b2fadc0adbe54471ffd79a729
// 16位雜湊結果
MD5(Message Digest Algorithm,16) = 2fadc0adbe54471f

仔細觀察以上兩個雜湊結果,發現其中間部分完全相同均為2fadc0adbe54471f
因此猜測16位長度的雜湊結果為:32位雜湊結果去掉前八位、後八位得到的。

1.2 用途

平時的軟體研發中經常使用MD5校驗訊息是否被篡改、驗證檔案完整性。

  • 驗證是否被篡改:
    比如,上傳下載檔案。
    資料的 傳送方 將原始資料生成MD5摘要,然後把 原始資料 與其 MD5摘要一起傳送給 接收方;
    接收方收到資料後,先將原始資料用MD5演算法生成摘要資訊,然後再將此摘要資訊與傳送方發過來的摘要資訊進行比較,如果一致就認為原始資料沒有被修改、或者損壞。
  • 防止抵賴:
    例如A寫了一個檔案,某認證機構對此檔案用MD5演算法產生摘要資訊並做好記錄。
    若以後A說這檔案不是他寫的,權威機構只需對此檔案重新產生摘要資訊,然後跟記錄在冊的摘要資訊進行比對,若摘要資訊相同,則證明為A寫的檔案。

1.3 不安全

2011年,RFC 6151 禁止MD5用作金鑰雜湊訊息認證碼。

  • MD5不安全主要指的是,不可用MD5對原始祕鑰進行加密
    比如:將使用者的登入祕鑰進行MD5加密後,儲存於資料庫中。
    MD5雖然理論上不可逆,但有些黑客網站通過查字典方式獲取MD5原文資訊。
    提前將一些比較常見的密文做MD5運算,將結果儲存下來,破譯密文時,通過MD5摘要資訊直接查詢原文。
    比如:字串 123 的MD5值是 202cb962ac59075b964b07152d234b70 ,黑客在破解後的資料庫中看到某位使用者的密碼是 202cb962ac59075b964b07152d234b70 ,通過字典一查就知道密碼明文是 123 了。
  • MD5的碰撞性,決定了存在兩個不用的輸入資訊,其MD5相同的可能。
    2009年,中國科學院的謝濤和馮登國僅用了 2的20.96次冪 的碰撞演算法複雜度,破解了MD5的碰撞抵抗,該攻擊在普通計算機上執行只需要數秒鐘。

二、演算法原理

MD5 摘要演算法大概計算過程可以描述如下:
MD5 將 “輸入資訊” 分為N*512bit的資料分組;
每一512bit分組又分為16個子分組,每個子分組為32bit的原始資料;
16個子分組分別命名為 M0~M15
每個子分組都要進行4次運算,運算公式分別為FF、GG、HH、II;
總的運算次數為N*16*4(運算均為位運算)。

“輸入資訊” 分組計算情況如下圖所示:

MD5分組計算

以上為MD5 摘要演算法的大概原理總結,下邊按照 rfc1321 中演算法的介紹順序,梳理MD5 摘要演算法:

  • 填充資料
    填充資料,使 輸入資料 % 512 = 448
  • 填充長度資訊
    補充 “輸入資訊” 位長 (Bits Length)資訊,佔用空間64位
  • 初始化A、B、C、D 四個資料
    初始化 A、B、C、D 四個資料,用於後續的分組計算
  • 分組資料運算
    512bit分組資料,需進行16 * 4 = 64次運算
  • 結果累加

2.1 填充資料

首先需要對 “輸入資訊” 進行填充,使其位長對512求餘結果448(填充必須進行,即使其位長對512求餘的結果等於448)。

填充資料的方式:
在 “輸入資訊” 的後面填充一個1和無數個0,直到滿足上面的條件時才停止資訊填充

填充後的 “輸入資訊” 其位長 (Bits Length) 將擴充套件到:
N*512+448 ( N>=0 )

2.2 補充長度資訊

64bit記錄 “輸入資訊” 的位長 (Bits Length),把64位長度二進位制資料補在最後。

經過此步驟後,其位長 (Bits Length) 將擴充套件到:
N*512+448+64 = (N+1)*512 ( N>=0 )

2.3 初始化A、B、C、D

這裡需要初始化四個資料 A、B、C、D,這四個變數將用於後續的公式計算。
四個資料均為8個16進位制資料組合,每個16進位制資料為4bit,每個資料佔32bit

// 每個資料佔空間 32bit 
// 四個資料分別為 8個 16進位制資料的組合構成
// 單個16進位制資料佔空間 4bit
A: 01 23 45 67 (16進位制)
B: 89 ab cd ef (16進位制)
C: fe dc ba 98 (16進位制)
D: 76 54 32 10 (16進位制)

將A、B、C、D輸入計算機進行計算時,A、B、C、D將變化為:

A: 0x67452301
B: 0xefcdab89
C: 0x98badcfe
D: 0x10325476

為什麼會變化為 0x67452301、0xefcdab89、0x98badcfe、0x10325476 ?

// A的16進製表示
A: 01 23 45 67 (16進位制)
// A的二進位制表示
A: 00000 0001 0010 0011 0100 0101 0110 0111 (二進位制)
// 計算機中首先編寫的為低位元組位,當從右向左獲取位元組資料(8位一個位元組)時,最終A將變化為0x67452301
A: 67 45 23 01 (16進位制)

2.4 分組資料運算

上文層提到子分組的運算公式:FF、GG、HH、II ,32bit子分組運算公式如下:

// FF、GG、HH、II
// <<< 為迴圈左移
FF(a ,b ,c ,d ,Mj ,s ,ti) 操作為 a = b + ( (a + F(b,c,d) + Mj + ti) <<< s)
GG(a ,b ,c ,d ,Mj ,s ,ti) 操作為 a = b + ( (a + G(b,c,d) + Mj + ti) <<< s)
HH(a ,b ,c ,d ,Mj ,s ,ti) 操作為 a = b + ( (a + H(b,c,d) + Mj + ti) <<< s)
II(a ,b ,c ,d ,Mj ,s ,ti) 操作為 a = b + ( (a + I(b,c,d) + Mj + ti) <<< s)

// F、G、H、I
F( X ,Y ,Z ) = ( X & Y ) | ( (~X) & Z )
G( X ,Y ,Z ) = ( X & Z ) | ( Y & (~Z) )
H( X ,Y ,Z ) =X ^ Y ^ Z
I( X ,Y ,Z ) =Y ^ ( X | (~Z) )
  • 公式中初始輸入資料a、b、c、d 為A、B、C、D
  • Mj 代表32bit子分組資料,每個子分組資料均需要經過 FF、GG、HH、II 四次運算:
    512bit原始輸入資料,有16個子分組,每個分組進行4次運算,總共16 * 4 = 64次運算。
  • s 常量資料,代表迴圈左移的位數。
  • ti 常量;

512bit分組資料,64 次位運算如下(輸入資料為32bit原始資料,輸出為32bit資料):

// 512bit分組資料,16 * 4 次運算
// 輸入資料為32bit原始資料,輸出為32bit資料
// 第一次運算FF
a = FF(a, b, c, d, M0, 7, 0xd76aa478L);
d = FF(d, a, b, c, M1, 12, 0xe8c7b756L);
c = FF(c, d, a, b, M2, 17, 0x242070dbL);
b = FF(b, c, d, a, M3, 22, 0xc1bdceeeL);
a = FF(a, b, c, d, M4, 7, 0xf57c0fafL);
d = FF(d, a, b, c, M5, 12, 0x4787c62aL);
c = FF(c, d, a, b, M6, 17, 0xa8304613L);
b = FF(b, c, d, a, M7, 22, 0xfd469501L);
a = FF(a, b, c, d, M8, 7, 0x698098d8L); 
d = FF(d, a, b, c, M9, 12, 0x8b44f7afL);
c = FF(c, d, a, b, M10, 17, 0xffff5bb1L);
b = FF(b, c, d, a, M11, 22, 0x895cd7beL);
a = FF(a, b, c, d, M12, 7, 0x6b901122L);
d = FF(d, a, b, c, M13, 12, 0xfd987193L);
c = FF(c, d, a, b, M14, 17, 0xa679438eL);
b = FF(b, c, d, a, M15, 22, 0x49b40821L);

// 第二輪運算GG
a = GG(a, b, c, d, M1, 5, 0xf61e2562L);
d = GG(d, a, b, c, M6, 9, 0xc040b340L);
c = GG(c, d, a, b, M11, 14, 0x265e5a51L);
b = GG(b, c, d, a, M0, 20, 0xe9b6c7aaL);
a = GG(a, b, c, d, M5, 5, 0xd62f105dL);
d = GG(d, a, b, c, M10, 9, 0x2441453L);
c = GG(c, d, a, b, M15, 14, 0xd8a1e681L);
b = GG(b, c, d, a, M4, 20, 0xe7d3fbc8L);
a = GG(a, b, c, d, M9, 5, 0x21e1cde6L);
d = GG(d, a, b, c, M14, 9, 0xc33707d6L);
c = GG(c, d, a, b, M3, 14, 0xf4d50d87L);
b = GG(b, c, d, a, M8, 20, 0x455a14edL);
a = GG(a, b, c, d, M13, 5, 0xa9e3e905L);
d = GG(d, a, b, c, M2, 9, 0xfcefa3f8L);
c = GG(c, d, a, b, M7, 14, 0x676f02d9L);
b = GG(b, c, d, a, M12, 20, 0x8d2a4c8aL);

// 第三輪運算HH
a = HH(a, b, c, d, M5, 4, 0xfffa3942L);
d = HH(d, a, b, c, M8, 11, 0x8771f681L);
c = HH(c, d, a, b, M11, 16, 0x6d9d6122L);
b = HH(b, c, d, a, M14, 23, 0xfde5380cL);
a = HH(a, b, c, d, M1, 4, 0xa4beea44L);
d = HH(d, a, b, c, M4, 11, 0x4bdecfa9L);
c = HH(c, d, a, b, M7, 16, 0xf6bb4b60L);
b = HH(b, c, d, a, M10, 23, 0xbebfbc70L);
a = HH(a, b, c, d, M13, 4, 0x289b7ec6L);
d = HH(d, a, b, c, M0, 11, 0xeaa127faL);
c = HH(c, d, a, b, M3, 16, 0xd4ef3085L);
b = HH(b, c, d, a, M6, 23, 0x4881d05L);
a = HH(a, b, c, d, M9, 4, 0xd9d4d039L);
d = HH(d, a, b, c, M12, 11, 0xe6db99e5L);
c = HH(c, d, a, b, M15, 16, 0x1fa27cf8L);
b = HH(b, c, d, a, M2, 23, 0xc4ac5665L);

// 第四輪運算II
a = II(a, b, c, d, M0, 6, 0xf4292244L);
d = II(d, a, b, c, M7, 10, 0x432aff97L);
c = II(c, d, a, b, M14, 15, 0xab9423a7L);
b = II(b, c, d, a, M5, 21, 0xfc93a039L);
a = II(a, b, c, d, M12, 6, 0x655b59c3L);
d = II(d, a, b, c, M3, 10, 0x8f0ccc92L);
c = II(c, d, a, b, M10, 15, 0xffeff47dL);
b = II(b, c, d, a, M1, 21, 0x85845dd1L);
a = II(a, b, c, d, M8, 6, 0x6fa87e4fL);
d = II(d, a, b, c, M15, 10, 0xfe2ce6e0L);
c = II(c, d, a, b, M6, 15, 0xa3014314L);
b = II(b, c, d, a, M13, 21, 0x4e0811a1L);
a = II(a, b, c, d, M4, 6, 0xf7537e82L);
d = II(d, a, b, c, M11, 10, 0xbd3af235L);
c = II(c, d, a, b, M2, 15, 0x2ad7d2bbL);
b = II(b, c, d, a, M9, 21, 0xeb86d391L);

2.5 結果累加

若A、B、C、D為變數,並且A、B、C、D的初始化資訊為 A: 0x67452301;B: 0xefcdab89;C: 0x98badcfe;D: 0x10325476 ,每一512bit分組的運算結果為a、b、c、d。則第N個512bit組的計算結果為:

// a、b、c、d 為每一512bit分組的運算結果; 
// A、B、C、D 是下一組計算的輸入引數;
// 若無下一個512bit分組 A、B、C、D 則為最終計算結果;
A = a + A;  
B = b + B; 
C = c + C; 
D = d + D;

三、編碼實現 MD5 摘要演算法

網上找到一個用Java編碼實現MD5摘要演算法的案例,我從頭到尾加了詳細的註釋。因此對於程式碼實現,朋友們可以結合註釋讀程式碼,打日誌進行MD5摘要演算法分析、學習。


/**
 * Java 實現MD5摘要演算法:
 * 基本每一行我都加了註釋,因此不再對程式碼進行詳細介紹,
 * 如有疑問,可聯絡:xiaxveliang@163.com
 */
public class MD5Hash {

    /**
     * RFC1321中定義的標準4*4矩陣的常量:迴圈位移常量資料 s
     */
    static final int S11 = 7, S12 = 12, S13 = 17, S14 = 22;
    static final int S21 = 5, S22 = 9, S23 = 14, S24 = 20;
    static final int S31 = 4, S32 = 11, S33 = 16, S34 = 23;
    static final int S41 = 6, S42 = 10, S43 = 15, S44 = 21;

    /**
     * 填充資料 1000 0000 0000 ...
     * 長度:64*8 = 512bit
     * 注:-128為1000 0000
     */
    static final byte[] PADDING =
            {
                    -128, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
                    0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
                    0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
                    0, 0, 0, 0, 0, 0, 0
            };
    /**
     * a、b、c、d 四個變數
     */
    private long[] abcd = new long[4];

    /**
     * 512位元組分組資料緩衝 64*8=512bit
     */
    private byte[] buffer512Bit = new byte[64];
    // 輸入資料的位長資訊(64bit)
    private long[] inputBitCount = new long[2];


    /**
     * MD5計算結果
     */
    // MD5計算結果:16 * 8bit = 128bit
    public byte[] md5ByteArray = new byte[16];
    // MD5計算結果:字串表示的MD5計算結果
    public String md5ResultStr;


    /**
     * 呼叫其可對任意字串進行加密運算,並以字串形式返回加密結果。
     *
     * @param inputStr 輸入字串
     * @return 輸入md5計算結果
     */
    public String getMD5(String inputStr) {
        // 資料初始化A、B、C、D
        md5Init();
        // 呼叫MD5的主計算過程
        md5Update(inputStr.getBytes(), inputStr.length());
        // 輸出結果到digest陣列中
        md5Final();
        // 轉化為16進位制字串
        for (int i = 0; i < 16; i++) {
            md5ResultStr += byte2HEX(md5ByteArray[i]);
        }
        return md5ResultStr;
    }

    // #######################################################

    /**
     * 構造方法:初始化MD5核心變數
     */
    public MD5Hash() {
        md5Init();
    }

    /**
     * 初始化MD5核心變數
     */
    private void md5Init() {
        // 定義state為RFC1321中定義的標準幻數
        abcd[0] = 0x67452301L;
        abcd[1] = 0xefcdab89L;
        abcd[2] = 0x98badcfeL;
        abcd[3] = 0x10325476L;
        // 初始化 輸入資料的位長資訊
        inputBitCount[0] = inputBitCount[1] = 0L;

        // MD5計算結果:初始化digest陣列元素為0
        for (int i = 0; i < 16; i++) {
            md5ByteArray[i] = 0;
        }
        // MD5計算結果:初始化resultStr
        md5ResultStr = "";
    }


    /**
     * MD5的主計算過程:
     *
     * @param inputByte    輸入資料位元組流
     * @param inputByteLen 輸入資料位元組長度
     */
    private void md5Update(byte[] inputByte, int inputByteLen) {
        int i, index, partLen;

        // 分配64個位元組分組緩衝區:64*8bit = 512bit
        byte[] blockByteArray = new byte[64];

        // 新增inputByte資訊前輸入資訊 位元組長度(取低6位)
        index = (int) (inputBitCount[0] >>> 3) & 0x3F;
        System.out.println("index: " + index);
        // 新增inputByteLen資訊後,最新的輸入資訊 位長
        // (inputByteLen << 3) = (inputByteLen * 8) 為輸入資料位長(bit length)
        if ((inputBitCount[0] += (inputByteLen << 3)) < (inputByteLen << 3)) {
            inputBitCount[1]++;
        }
        // 0
        inputBitCount[1] += (inputByteLen >>> 29);

        // 差多少滿512bit(64位元組)
        partLen = 64 - index;

        if (inputByteLen >= partLen) {
            // 拷貝 partLen 位元組資料
            // 資料運算
            md5Memcpy(buffer512Bit, inputByte, index, 0, partLen);
            md5Transform(buffer512Bit);
            //
            for (i = partLen; i + 63 < inputByteLen; i += 64) {
                // 拷貝64位元組資料
                // 資料運算
                md5Memcpy(blockByteArray, inputByte, 0, i, 64);
                md5Transform(blockByteArray);
            }
            index = 0;
        } else {
            i = 0;
        }
        // 拷貝64位元組資料
        md5Memcpy(buffer512Bit, inputByte, index, i, inputByteLen - i);
    }

    /**
     * 整理和填寫輸出結果,結果放到陣列digest中。
     */
    private void md5Final() {
        /**
         * 64位輸入資料的位長資訊(bit length)
         * 陣列中:低位在前,高位在後
         */
        // 8個位元組 快取空間 8 * 8bit = 64bit
        byte[] bits = new byte[8];
        longArray2ByteArray(bits, inputBitCount, 8);

        // 輸入資訊的位元組數byte length
        int index = (int) (inputBitCount[0] >>> 3) & 0x3f;
        // 輸入資訊的位長<448,補充到448;輸入資訊的位長>=448,補充到(512+448)= 960,960/8=120位元組
        // (56 * 8bit = 448bit)
        int padLen = (index < 56) ? (56 - index) : (120 - index);

        /**
         * 資料填充: N * 512 + 448
         */
        md5Update(PADDING, padLen);
        /**
         * 1、資料填充: N * 512 + 448 + 64
         * 2、計算最後一個分組資料
         */
        md5Update(bits, 8);

        /**
         * 根據a、b、c、d 得到最終的 md5ByteArray 資料結果
         * 陣列結果中(低位在前,高位在後)
         */
        longArray2ByteArray(md5ByteArray, abcd, 16);
    }

    /**
     * MD5核心變換計算程式: 由md5Update函式呼叫,block是分塊的原始位元組陣列
     *
     * @param blockByteArray 512bit分組資料,分為16個子分組,每個分組32bit資料
     */
    private void md5Transform(byte blockByteArray[]) {
        // 初始化a、b、c、d
        long a = abcd[0], b = abcd[1], c = abcd[2], d = abcd[3];
        // 512bit分成16個子分組,每個分組32bit
        // 16 * 32bit = 512bit
        long[] M32 = new long[16];
        byteArray2LongArray(M32, blockByteArray, 64);
        // 進行4級級聯運算
        // 第1級
        a = FF(a, b, c, d, M32[0], S11, 0xd76aa478L); /* 1 */
        d = FF(d, a, b, c, M32[1], S12, 0xe8c7b756L); /* 2 */
        c = FF(c, d, a, b, M32[2], S13, 0x242070dbL); /* 3 */
        b = FF(b, c, d, a, M32[3], S14, 0xc1bdceeeL); /* 4 */
        a = FF(a, b, c, d, M32[4], S11, 0xf57c0fafL); /* 5 */
        d = FF(d, a, b, c, M32[5], S12, 0x4787c62aL); /* 6 */
        c = FF(c, d, a, b, M32[6], S13, 0xa8304613L); /* 7 */
        b = FF(b, c, d, a, M32[7], S14, 0xfd469501L); /* 8 */
        a = FF(a, b, c, d, M32[8], S11, 0x698098d8L); /* 9 */
        d = FF(d, a, b, c, M32[9], S12, 0x8b44f7afL); /* 10 */
        c = FF(c, d, a, b, M32[10], S13, 0xffff5bb1L); /* 11 */
        b = FF(b, c, d, a, M32[11], S14, 0x895cd7beL); /* 12 */
        a = FF(a, b, c, d, M32[12], S11, 0x6b901122L); /* 13 */
        d = FF(d, a, b, c, M32[13], S12, 0xfd987193L); /* 14 */
        c = FF(c, d, a, b, M32[14], S13, 0xa679438eL); /* 15 */
        b = FF(b, c, d, a, M32[15], S14, 0x49b40821L); /* 16 */

        // 第2級
        a = GG(a, b, c, d, M32[1], S21, 0xf61e2562L); /* 17 */
        d = GG(d, a, b, c, M32[6], S22, 0xc040b340L); /* 18 */
        c = GG(c, d, a, b, M32[11], S23, 0x265e5a51L); /* 19 */
        b = GG(b, c, d, a, M32[0], S24, 0xe9b6c7aaL); /* 20 */
        a = GG(a, b, c, d, M32[5], S21, 0xd62f105dL); /* 21 */
        d = GG(d, a, b, c, M32[10], S22, 0x2441453L); /* 22 */
        c = GG(c, d, a, b, M32[15], S23, 0xd8a1e681L); /* 23 */
        b = GG(b, c, d, a, M32[4], S24, 0xe7d3fbc8L); /* 24 */
        a = GG(a, b, c, d, M32[9], S21, 0x21e1cde6L); /* 25 */
        d = GG(d, a, b, c, M32[14], S22, 0xc33707d6L); /* 26 */
        c = GG(c, d, a, b, M32[3], S23, 0xf4d50d87L); /* 27 */
        b = GG(b, c, d, a, M32[8], S24, 0x455a14edL); /* 28 */
        a = GG(a, b, c, d, M32[13], S21, 0xa9e3e905L); /* 29 */
        d = GG(d, a, b, c, M32[2], S22, 0xfcefa3f8L); /* 30 */
        c = GG(c, d, a, b, M32[7], S23, 0x676f02d9L); /* 31 */
        b = GG(b, c, d, a, M32[12], S24, 0x8d2a4c8aL); /* 32 */

        // 第3級
        a = HH(a, b, c, d, M32[5], S31, 0xfffa3942L); /* 33 */
        d = HH(d, a, b, c, M32[8], S32, 0x8771f681L); /* 34 */
        c = HH(c, d, a, b, M32[11], S33, 0x6d9d6122L); /* 35 */
        b = HH(b, c, d, a, M32[14], S34, 0xfde5380cL); /* 36 */
        a = HH(a, b, c, d, M32[1], S31, 0xa4beea44L); /* 37 */
        d = HH(d, a, b, c, M32[4], S32, 0x4bdecfa9L); /* 38 */
        c = HH(c, d, a, b, M32[7], S33, 0xf6bb4b60L); /* 39 */
        b = HH(b, c, d, a, M32[10], S34, 0xbebfbc70L); /* 40 */
        a = HH(a, b, c, d, M32[13], S31, 0x289b7ec6L); /* 41 */
        d = HH(d, a, b, c, M32[0], S32, 0xeaa127faL); /* 42 */
        c = HH(c, d, a, b, M32[3], S33, 0xd4ef3085L); /* 43 */
        b = HH(b, c, d, a, M32[6], S34, 0x4881d05L); /* 44 */
        a = HH(a, b, c, d, M32[9], S31, 0xd9d4d039L); /* 45 */
        d = HH(d, a, b, c, M32[12], S32, 0xe6db99e5L); /* 46 */
        c = HH(c, d, a, b, M32[15], S33, 0x1fa27cf8L); /* 47 */
        b = HH(b, c, d, a, M32[2], S34, 0xc4ac5665L); /* 48 */

        // 第4級
        a = II(a, b, c, d, M32[0], S41, 0xf4292244L); /* 49 */
        d = II(d, a, b, c, M32[7], S42, 0x432aff97L); /* 50 */
        c = II(c, d, a, b, M32[14], S43, 0xab9423a7L); /* 51 */
        b = II(b, c, d, a, M32[5], S44, 0xfc93a039L); /* 52 */
        a = II(a, b, c, d, M32[12], S41, 0x655b59c3L); /* 53 */
        d = II(d, a, b, c, M32[3], S42, 0x8f0ccc92L); /* 54 */
        c = II(c, d, a, b, M32[10], S43, 0xffeff47dL); /* 55 */
        b = II(b, c, d, a, M32[1], S44, 0x85845dd1L); /* 56 */
        a = II(a, b, c, d, M32[8], S41, 0x6fa87e4fL); /* 57 */
        d = II(d, a, b, c, M32[15], S42, 0xfe2ce6e0L); /* 58 */
        c = II(c, d, a, b, M32[6], S43, 0xa3014314L); /* 59 */
        b = II(b, c, d, a, M32[13], S44, 0x4e0811a1L); /* 60 */
        a = II(a, b, c, d, M32[4], S41, 0xf7537e82L); /* 61 */
        d = II(d, a, b, c, M32[11], S42, 0xbd3af235L); /* 62 */
        c = II(c, d, a, b, M32[2], S43, 0x2ad7d2bbL); /* 63 */
        b = II(b, c, d, a, M32[9], S44, 0xeb86d391L); /* 64 */

        //分別累加到 a[0], b[1], c[2], d[3]
        abcd[0] += a;
        abcd[1] += b;
        abcd[2] += c;
        abcd[3] += d;
    }


    // #######################################################

    //定義F G H I 為4個基數 ,即為4個基本的MD5函式,進行簡單的位運算
    private long F(long x, long y, long z) {
        return (x & y) | ((~x) & z);
    }

    private long G(long x, long y, long z) {
        return (x & z) | (y & (~z));
    }

    private long H(long x, long y, long z) {
        return x ^ y ^ z;
    }

    private long I(long x, long y, long z) {
        return y ^ (x | (~z));
    }

    // FF,GG,HH和II呼叫F,G,H,I函式進行進一步變換
    private long FF(long a, long b, long c, long d, long x, long s, long ac) {
        a += F(b, c, d) + x + ac;
        // 迴圈左移s位
        //這裡long型資料右移時使用無符號右移運算子>>>
        a = ((int) a << s) | ((int) a >>> (32 - s));
        a += b;
        return a;
    }

    private long GG(long a, long b, long c, long d, long x, long s, long ac) {
        a += G(b, c, d) + x + ac;
        // 迴圈左移s位
        //這裡long型資料右移時使用無符號右移運算子>>>
        a = ((int) a << s) | ((int) a >>> (32 - s));
        a += b;
        return a;
    }

    private long HH(long a, long b, long c, long d, long x, long s, long ac) {
        a += H(b, c, d) + x + ac;
        // 迴圈左移s位
        //這裡long型資料右移時使用無符號右移運算子>>>
        a = ((int) a << s) | ((int) a >>> (32 - s));
        a += b;
        return a;
    }

    private long II(long a, long b, long c, long d, long x, long s, long ac) {
        a += I(b, c, d) + x + ac;
        // 迴圈左移s位
        //這裡long型資料右移時使用無符號右移運算子>>>
        a = ((int) a << s) | ((int) a >>> (32 - s));
        a += b;
        return a;
    }

    // #######################################################


    /**
     * byte陣列的塊拷貝函式:將input陣列中的起始位置為inpos,長度len的資料拷貝到output陣列起始位置outpos處
     */
    private void md5Memcpy(byte[] output, byte[] input, int outpos, int inpos,
                           int len) {
        int i;
        for (i = 0; i < len; i++) {
            output[outpos + i] = input[inpos + i];
        }
    }

    // #######################################################


    /**
     * 把byte型別的資料轉換成十六進位制ASCII字元表示
     *
     * @param in
     * @return
     */
    private static String byte2HEX(byte in) {
        char[] digitStr =
                {
                        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
                        'A', 'B', 'C', 'D', 'E', 'F'
                };
        char[] out = new char[2];
        out[0] = digitStr[(in >> 4) & 0x0F]; //取高4位
        out[1] = digitStr[in & 0x0F];        //取低4位
        String s = new String(out);
        return s;
    }

    /**
     * 將long型陣列按順序拆成byte型陣列 (低位在前,高位在後)
     *
     * @param outputByteArray 輸出byte陣列
     * @param inputLongArray  輸入long陣列
     * @param byteLength      outputByteArray位元組陣列的長度
     */
    private void longArray2ByteArray(byte[] outputByteArray, long[] inputLongArray, int byteLength) {
        int i, j;
        for (i = 0, j = 0; j < byteLength; i++, j += 4) {
            // 低8位
            outputByteArray[j] = (byte) (inputLongArray[i] & 0xffL);
            // 中間8位[低]
            outputByteArray[j + 1] = (byte) ((inputLongArray[i] >>> 8) & 0xffL);
            // 中間8位[高]
            outputByteArray[j + 2] = (byte) ((inputLongArray[i] >>> 16) & 0xffL);
            // 高8位
            outputByteArray[j + 3] = (byte) ((inputLongArray[i] >>> 24) & 0xffL);
        }
    }

    /**
     * 將byte型陣列按順序合成long型陣列,長度為len
     *
     * @param output
     * @param input
     * @param len
     */
    private void byteArray2LongArray(long[] output, byte[] input, int len) {
        int i, j;
        for (i = 0, j = 0; j < len; i++, j += 4) {
            output[i] = byte2Long(input[j])
                    | (byte2Long(input[j + 1]) << 8)
                    | (byte2Long(input[j + 2]) << 16)
                    | (byte2Long(input[j + 3]) << 24);
        }
    }

    /**
     * 把byte型資料轉換為無符號long型資料
     *
     * @param b
     * @return
     */
    private static long byte2Long(byte b) {
        return b > 0 ? b : (b & 0x7F + 128);
    }
}


四、MD5 API使用

Java中使用Java API實現MD5的程式碼片段,記錄一下,留著以後 coding 時快速使用:

public static String getMd5(String inputStr) {
    String md5Str = "";
    // 判空處理
    if (inputStr == null || inputStr.equals("")) {
        return md5Str;
    }
    try {
        //
        // 1、得到長度為16的byte位元組陣列
        MessageDigest md = MessageDigest.getInstance("md5");
        md.update(inputStr.getBytes());
        byte[] bytes = md.digest();
        //
        // 2、長度為16的byte位元組陣列,轉化為長度為32的字串
        StringBuilder sb = new StringBuilder();
        for (byte b : bytes) {
            // 轉化為16進位制字串
            String hexStr = Integer.toHexString(b & 0xFF);
            // 字串長度為1時補0
            if (hexStr.length() == 1) {
                sb.append("0");
            }
            sb.append(hexStr);
        }
        // 得到長度為32的字串
        md5Str = sb.toString();
    } catch (Exception e) {
        e.printStackTrace();
    }
    return md5Str;
}

五、參考:

MD5 Message-Digest:
https://datatracker.ietf.org/doc/html/rfc1321

RFC 6151:
https://datatracker.ietf.org/doc/html/rfc6151

維基百科MD5:
https://zh.wikipedia.org/wiki/MD5

MD5演算法原理:
https://www.cnblogs.com/nhdlb/p/12007162.html

MD5演算法:
https://blog.csdn.net/sinat_27933301/article/details/79538169

= THE END =

歡迎關注我的公眾號

相關文章