php二進位制安全的含義

王明輝發表於2016-07-27

PHP裡,有string的概念。string裡,每個字元的大小為byte(與PHP相比,Java的每個字元為Character,是UTF8字元,C語言的每個字元可以在編譯時選擇)。

byte裡,有ASCII程式碼的字元,例如ABC,123,abc,也有一些特殊字元,例如回車,退格之類的。
特殊字元很多是不能顯示的。或者說,他們的顯示方式沒有標準,例如編碼65到哪兒都是字母A,編碼97到哪兒都是字元a,退格在有的地方顯示成一個符號,在有的地方就會真的把前一個字元退掉。
PHP以C為基礎,所以很多描述都是以C為對比。C的字串裡,一種經典的定義就是,以編碼0作為字串的結尾。那麼,假設這樣一個string,裡面3個字元的編碼分別是97,0,97。那麼,C裡面如果有str_replace等效的函式, 利用它把97換成98,那麼這個函式讀取到0的時候,就認為已經結束了,就會得到98,0,97。跟它對應的,PHP裡的str_replace是二進位制安全的,那麼這個0不會被視為特殊的結束符號,於是結果就是98,0,98。
【二進位制安全】在PHP文件裡,基本就是這麼一個意思:C語言裡的功能類似的函式會對有的字元特別處理,而PHP這個函式對於所有字元一視同仁,不用擔心會有特殊字元影響處理,特別不用擔心編碼0字元。

相關文章