PHP的bz2壓縮擴充套件工具

pswyjz發表於2021-09-09

在日常的開發和電腦使用中,我們經常會接觸到壓縮和解壓的一些工具,PHP 也為我們準備了很多相關的操作擴充套件包,都有直接可用的函式能夠方便的操作一些壓縮解壓功能。今天,我們先學習一個比較簡單但不太常用的壓縮格式:Bzip2。

安裝擴充套件

這個擴充套件的安裝需要系統有 bzip2-devel 。所以我們需要先給系統裝上這個軟體包的支援,然後這個擴充套件是隨 PHP 安裝包一起釋出的,所以只需要編譯一下 PHP ,並在 ./configure 中新增對應的編譯命令即可。

# yum install bzip2-devel
# ./configure xxxx --with-bz2
# make && make install

基本操作

Bzip2 提供的函式不多,而且非常簡單,我們首先來看的是將字串儲存到一個檔案中。

$bz = bzopen('/tmp/test.bz', 'w');
// -rw-r--r-- 1 root root 14 Jun 28 09:51 test.bz

$text = "This is Bz Compress";
bzwrite($bz, $text);
// -rw-r--r-- 1 root root 59 Jun 28 09:53 test.bz

bzclose($bz);

$bz = bzopen('/tmp/test.bz', 'r');

$v = bzread($bz);
echo $v, PHP_EOL;
// This is Bz Compress

bzclose($bz);

就和檔案操作函式一樣,我們需要先透過 bzopen() 開啟檔案獲得控制程式碼。然後使用 bzwrite() 來寫入檔案,並使用 bzread() 來讀取檔案。最後使用 bzclose() 來關閉檔案。

這裡需要注意的是 bzopen() 的第二個引數,也就是檔案開啟的形式,只能寫 “w” 或者 “r” 。它沒有其它型別,並且不能同時讀寫,也就是不能寫成 “wr” 這種形式。所以我們在寫完檔案後又要再使用 “r” 開啟檔案才能進行讀取。

讀取長度設定

$bz = bzopen('/tmp/test.bz', 'r');

$v = bzread($bz, 10);
echo $v, PHP_EOL;
// This is Bz

$v = bzread($bz);
echo $v, PHP_EOL;
//  Compress

bzclose($bz);

bzread() 的第二個引數是可選的位元組長度,預設是 1024 ,一次最大可讀入 8192 個未壓縮位元組。

字串編碼

Bzip2 擴充套件還為我們提供了直接對字串編碼的函式。不用每次都存入檔案中,如果是相同的字串,使用字串編碼的函式和輸出到檔案中的內容是一樣的亂碼的二進位制內容。

$str = "Test compress String";

$bzstr = bzcompress($str, 9);
echo $bzstr, PHP_EOL;
// BZh91AY&SY��J���@
//
// �� 1
// df����2�h>.�p�!��//

$newStr = bzdecompress($bzstr);
echo $newStr, PHP_EOL;

$chineseStr = "測試";
$bzstr = bzcompress($chineseStr, 9);
echo bzdecompress($bzstr), PHP_EOL;

bzcompress() 用於將字串進行編碼壓縮,第二個引數是壓縮的比率,9 為最高等級。編碼後的內容是非人類的二進位制亂碼內容。bzdecompress() 用於對已編碼的內容進行解碼。相信不少小夥伴已經發現了,這個可以用來做一些保密內容的加密傳輸。同時,在測試程式碼中,我們可以看到,它對中文也是正常支援的。

錯誤資訊

最後,我們來看一下 Bzip2 的錯誤處理函式。

$bz = bzopen('/tmp/test.bz', 'r');
bzwrite($bz, 'aaa');
print_r(bzerror($bz));
// Array
// (
//     [errno] => -1
//     [errstr] => SEQUENCE_ERROR
// )

echo bzerrno($bz), PHP_EOL; // -1
echo bzerrstr($bz), PHP_EOL; // SEQUENCE_ERROR

bzclose($bz);

我們首先構造了一個錯誤環境。使用 “r” 開啟檔案獲得控制程式碼後,對這個檔案進行寫入操作。bzerror() 會返回一個錯誤資訊的陣列,裡面包含了錯誤號和錯誤資訊內容。而 bzerrno() 和 bzerrstr() 則是單獨地分別返回錯誤號和錯誤內容。三個非常簡單並且好理解的函式。

總結

這個擴充套件還是非常簡單的,最主要的是 Bzip2 這種壓縮檔案型別也並不是非常常用的型別,所以可能知道的人並不多。但是我們還是從中發現了一絲絲的驚喜,就是它提供了字串的編解碼函式,這兩個函式確實是可以在某些場景下作為資訊加密的手段來使用。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/755/viewspace-2797694/,如需轉載,請註明出處,否則將追究法律責任。

相關文章