PHP的壓縮函式實現:gzencode、gzdeflate和gzcompress比較

pythontab發表於2014-06-13

gzencode 預設使用ZLIB_ENCODING_GZIP編碼,使用gzip壓縮格式,實際上是使用defalte 演算法壓縮資料,然後加上檔案頭和adler32校驗

gzdeflate 預設使用ZLIB_ENCODING_RAW編碼方式,使用deflate資料壓縮演算法,實際上是先用 LZ77 壓縮,然後用霍夫曼編碼壓縮

gzcompress ;預設使用ZLIB_ENCODING_DEFLATE編碼,使用zlib壓縮格式,實際上是用 deflate 壓縮資料,然後加上 zlib 頭和 CRC 校驗

這三個函式的比較實質上是三種壓縮方法:deflate, zlib, gzip的比較。

從效能的維度看:deflate 好於 gzip 好於 zlib

從文字檔案預設壓縮率壓縮後體積的維度看:deflate 好於 zlib 好於 gzip

這三種演算法中gzip 、zlib的作者都是Jean-Loup Gailly和 Mark Adler。

這兩種演算法以及圖形格式png,使用的壓縮演算法卻都是deflate演算法。

deflate演算法是同時使用了LZ77演算法與哈夫曼編碼(Huffman Coding)的一個無損資料壓縮演算法。

它最初是由Phil Katz為他的PKZIP歸檔工具第二版所定義的,後來定義在 RFC 1951規範中。

deflate演算法的壓縮與解壓的實現過程可以在壓縮庫zlib上找到。

PHP的壓縮實現依賴於zlib,zlib是一個提供了 deflate, zlib, gzip 壓縮方法的函式庫。

我們所使用的上面三個函式,將引數中的encoding轉為相同,壓縮率設定相同,則其最終呼叫的是同一個函式,效果和效能一樣。

PHP的zlib實現是以擴充套件的方式存在於ext/zlib目錄中。透過deflateInit2() + deflate() + deflateEnd()三個函式配合完成壓縮功能,inflateInit2() + inflate() + inflateEnd()三個函式配合完成解壓功能。壓縮最終都是透過php_zlib_encode函式實現呼叫,除了輸入的字串,壓縮率,結果的輸出外,不同的入口函式呼叫引數不同的是其encoding。deflateInit2的第四個引數指定encoding,PHP定義了三個常量:

#define PHP_ZLIB_ENCODING_RAW -0xf //deflate -15#define PHP_ZLIB_ENCODING_GZIP 0x1f //gzip 15 + 16#define PHP_ZLIB_ENCODING_DEFLATE 0x0f // zlib 15

三個函式在呼叫過程可以直接指定encoding使用其它的演算法:

zlib: ZLIB_ENCODING_DEFLATE gzip: ZLIB_ENCODING_GZIPdeflate: ZLIB_ENCODING_RAW

此三個函式是三種演算法的簡單呼叫方式,以更好的命名展現。三個函式間可以透過指定相同的encoding達到相同的效果,並且PHP也提供zlib_encode函式作為通用的壓縮函式。


相關文章