48 條高效率的 PHP 優化寫法

程式碼灣發表於2018-06-01

1 字串

1.1 少用正規表示式

能用PHP內部字串操作函式的情況下,儘量用他們,不要用正規表示式, 因為其效率高於正則。

沒得說,正則最耗效能。

str_replace函式要比preg_replace快得多,strtr函式又比str_replace來得快。

有沒有你漏掉的好用的函式?

例如:strpbrk()strncasecmp()strpos()strrpos()stripos()strripos()

1.2 字元替換

如果需要轉換的全是單個字元,用字串作為 strtr() 函式完成替換,而不是陣列:

$addr = strtr($addr, "abcd", "efgh");       // 建議
$addr = strtr($addr, array('a' => 'e', ));  // 不建議

效率提升:10 倍。

str_replace字元替換比正則替換preg_replace快,但strtrstr_replace又快1/4

另外,不要做無謂的替換,即使沒有替換,str_replace也會為其引數分配記憶體。很慢!

strpos 先查詢(非常快),看是否需要替換,如果需要,再替換。

如果需要替換,效率幾乎相等,差別在 0.1% 左右。

如果不需要替換:用 strpos200%

1.3 壓縮大的字串

使用 gzcompress()gzuncompress() 對容量大的字串進行壓縮和解壓,再存入和取出資料庫

這種內建的函式使用gzip演算法,能壓縮字串90%

1.4 echo 輸出

echo 字串用逗號代替點連線符更快些。

雖然,echo是一種語言結構,不是真正的函式。

但是,它可以把逗號隔開的多個字串當作“函式”引數傳入,所以速度會更快。

echo $str1, $str2;       // 速度快
echo $str1 . $str2;      // 速度稍慢

1.5 儘量用單引號

PHP 引擎允許使用單引號和雙引號來封裝字串變數,但是它們的速度是有很大的差別的!

使用雙引號的字串會告訴 PHP 引擎,首先去讀取字串內容,查詢其中的變數,並改為變數對應的值。

一般來說字串是沒有變數的,使用雙引號會導致效能不佳。

最好使用字串連線,而不是雙引號字串。

$output = "This is a plain string";  // 不好的實踐
$output = 'This is a plain string';  // 好的實踐

$type = "mixed";                     // 不好的實踐
$output = "This is a $type string";

$type = 'mixed';                     // 好的實踐
$output = 'This is a ' . $type . ' string';

1.6 使用isset代替strlen

在檢驗字串長度時,我們第一想法會使用 strlen() 函式。

此函式執行起來相當快,因為它不做任何計算,只返回在zval結構(C的內建資料結構,用於儲存PHP變數)中儲存的已知字串長度。

但是,由於strlen()是函式,多多少少會有些慢,因為函式呼叫會經過諸多步驟,如字母小寫化、雜湊查詢,會跟隨被呼叫的函式一起執行。

在某些情況下,你可以使用 isset() 技巧加速執行你的程式碼。例如:

if (strlen($foo) < 5) {
    echo "Foo is too short";
}

// 使用isset()
if (!isset($foo{5})) {
    echo "Foo is too short";
}

1.7 用split分割字串

在分割字串時,split()要比explode()快。

split()
0.001813 - 0.002271 seconds (avg 0.002042 seconds)
explode()
0.001678 - 0.003626 seconds (avg 0.002652 seconds)

1.8 echo效率高於print

因為echo沒有返回值,print返回一個整型。

注意:echo輸出大字串的時候,如果沒有調整就會嚴重影響效能。

開啟Apache的mod_deflate進行壓縮,或者開啟ob_start將內容放進緩衝區,可以改善效能問題。

2 語句

2.1 最好不用@

@掩蓋錯誤會降低指令碼執行速度,並且在後臺有很多額外操作。

@比起不用,效率差距 3 倍。特別不要在迴圈中使用@

在 5 次迴圈的測試中,即使是先用error_reporting(0)關掉錯誤,迴圈完成後再開啟,都比用@快。

2.2 避免使用魔術方法

對於__開頭的函式就命名為魔術函式,它們都在特定的條件下觸發。

這些魔術函式包括:__construct()__get()__call()__autoload()等等。

__autoload() 為例,如果不能將類名與實際的磁碟檔案對應起來,將不得不做大量的檔案存在判斷。

而判斷檔案存在需要磁碟I/O操作,眾所周知,磁碟I/O操作的效率很低,因此這才是使得autoload機制效率降低的原因。

因此,在系統設計時,需要定義一套清晰的、將類名與實際磁碟檔案對映的機制。

這個規則越簡單越明確,__autoload()機制的效率就越高。

autoload機制並不是天然的效率低下,只有濫用autoload、設計不好的自動裝載函式,才會導致其效率的降低.

所以說,儘量避免使用__autoload等魔術方法,有待商榷。

2.3 別在迴圈裡用函式

例如:

for($x=0; $x < count($array); $x++) {
}

這種寫法在每次迴圈的時候都會呼叫 count() 函式,效率大大降低,建議這樣:

$len = count($array);
for($x=0; $x < $len; $x++) {
}

讓函式在迴圈外面一次獲得迴圈次數。

2.4 使用三元運算子

在簡單的判斷語句中,三元運算子?:更簡潔高效。

2.5 使用選擇分支語句

switchcase好於使用多個ifelse if語句,並且程式碼更加容易閱讀和維護。

2.6 遮蔽敏感資訊

使用 error_reporting() 函式來預防潛在的敏感資訊顯示給使用者。

理想的錯誤報告應該被完全禁用在php.ini檔案裡。

如果用的是共享虛擬主機,php.ini不能修改,最好新增 error_reporting() 函式。

放在每個指令碼檔案的第一行,或者用require_once()來載入,能有效的保護敏感的SQL查詢和路徑,在出錯時不被顯示。

2.7 不實用段標籤<?

不要使用開始標誌的縮寫形式,你正在使用這樣的符號嗎<?,應該用完整的<?php開始標籤。

當然,如果是輸出變數,用<?= $value ?>這種方式是鼓勵的,可以是程式碼更加簡潔。

2.8 純PHP程式碼不加結束標記

如果檔案內容是純 PHP 程式碼,最好在檔案末尾刪除 PHP 結束標記?>

這可以避免在 PHP 結束標記之後萬一意外加入了空格或者換行符,會導致 PHP 開始輸出這些空白,而指令碼中此時並無輸出的意圖。

2.9 永遠不要使用register_globalsmagic quotes

這是兩個很古老的功能,在當時(十年前)也許是一個好方法,但現在看來並非如此。

老版本的PHP在安裝時會預設開啟這兩個功能,這會引起安全漏洞、程式設計錯誤及其他的問題。

如只有使用者輸入了資料時才會建立變數等。

PHP5.4.0開始這兩個功能都被捨棄了,所以每個程式設計師都應該避免使用。

如果你過去的程式有使用這兩項功能,那就儘快將其剔除吧。

3 函式

3.1 儘量使用PHP內部函式

內建函式使用C語言實現,並且經過PHP官方優化,效率更高。

3.2 使用絕對路徑

includerequire中儘量使用絕對路徑。

如果包含相對路徑,PHP會在include_path裡面遍歷查詢檔案。

用絕對路徑就會避免此類問題,解析路徑所需的時間會更少。

3.3 包含檔案

儘量不要用require_onceinclude_once包含檔案,它們多一個判斷檔案是否被引用的過程,能不用盡量不用。

而使用requireinclude方法代替。

鳥哥在其部落格中就多次宣告,儘量不要用require_onceinclude_once

3.4 函式快於類方法

呼叫只有一個引數、並且函式體為空的函式,花費的時間等於7-8$localvar++運算。

而同一功能的類方法大約為15次$localvar++運算。

3.5 用子類方法

基類裡面只放能重用的方法,其他功能儘量放在子類中實現,子類裡方法的效能優於在基類中。

3.6 類的效能和其方法數量沒有關係

新新增10個或多個方法到測試的類後,效能沒什麼差異。

3.7 讀取檔案內容

在可以用file_get_contents()替代file()fopen()feof()fgets()等系列方法的情況下,儘量用file_get_contents()

因為他的效率高得多!

3.8 引用傳遞引數

通過引數地址引用的方式,實現函式多個返回值,這比按值傳遞效率高。

方法是在引數變數前加個 &

3.9 方法不要細分得過多

仔細想想你真正打算重用的是哪些程式碼?

3.10 儘量靜態化

如果一個方法能被靜態,那就宣告它為靜態的,速度可提高1/4,甚至我測試的時候,這個提高了近三倍。

當然了,這個測試方法需要在十萬級以上次執行,效果才明顯。

其實,靜態方法和非靜態方法的效率主要區別在記憶體

靜態方法在程式開始時生成記憶體,例項方法(非靜態方法)在程式執行中生成記憶體。

所以,靜態方法可以直接呼叫,例項方法要先成生例項再呼叫,靜態速度很快,但是多了會佔記憶體。

任何語言都是對記憶體和磁碟的操作,至於是否物件導向,只是軟體層的問題,底層都是一樣的,只是實現方法不同。

靜態記憶體是連續的,因為是在程式開始時就生成了,而例項方法申請的是離散的空間,所以當然沒有靜態方法快。

靜態方法始終呼叫同一塊記憶體,其缺點就是不能自動進行銷燬,而例項化可以銷燬。

3.11 用C擴充套件方式實現

如果在程式碼中存在大量耗時的函式,可以考慮用C擴充套件的方式實現它們。

4 變數

4.1 及時銷燬變數

陣列物件GLOBAL變數在 PHP 中特別佔記憶體的,這個由於 PHP 的底層的zend引擎引起的。

一般來說,PHP陣列的記憶體利用率只有 1/10

也就是說,一個在C語言裡面100M 記憶體的陣列,在PHP裡面就要1G。

特別是,在PHP作為後臺伺服器的系統中,經常會出現記憶體耗費太大的問題。

4.2 使用$_SERVER變數

如果你需要得到指令碼執行的時間,$_SERVER['REQUSET_TIME']優於time()

一個是現成就可以直接用,一個還需要函式得出的結果。

4.3 方法裡建立區域性變數

在類的方法裡建立區域性變數速度最快,幾乎和在方法裡呼叫區域性變數一樣快。

4.4 區域性變數比全域性變數快

由於區域性變數是存在棧中的。

當一個函式佔用的棧空間不是很大的時候,這部分記憶體很有可能全部命中cache,CPU訪問的效率是很高的。

相反,如果一個函式同時使用全域性變數和區域性變數,當這兩段地址相差較大時,cpu cache需要來回切換,效率會下降。

4.5 區域性變數而不是物件屬性

建立一個物件屬性(類裡面的變數,例如:$this->prop++)比區域性變數要慢3倍。

4.6 提前宣告區域性變數

建立一個未宣告的區域性變數,要比建立一個已經定義過的區域性變數慢9-10倍。

4.7 謹慎宣告全域性變數

宣告一個未被任何一個函式使用過的全域性變數,也會使效能降低。

這和宣告相同數量的區域性變數一樣,PHP可能去檢查這個全域性變數是否存在。

4.8 使用++$i遞增

當執行變數$i的遞增或遞減時,$i++會比++$i慢一些。

這種差異是PHP特有的,並不適用於其他語言,所以請不要修改你的C或Java程式碼,並指望它們能立即變快,沒用的。

++$i更快是因為它只需要3條指令(opcodes),$i++則需要4條指令。

後置遞增實際上會產生一個臨時變數,這個臨時變數隨後被遞增。

而前置遞增直接在原值上遞增。

這是最優化處理的一種,正如Zend的PHP優化器所作的那樣。

牢記,這個優化處理不失為一個好主意,因為不是所有的指令優化器都會做同樣的優化處理。

4.9 不要隨便複製變數

有時候為了使 PHP 程式碼更加整潔,一些 PHP 新手(包括我)會把預定義好的變數,複製到一個名字更簡短的變數中。

其實這樣做的結果是增加了一倍的記憶體消耗,只會使程式更加慢。

試想一下,在下面的例子中,如果使用者惡意插入 512KB 位元組的文字,就會導致 1MB 的記憶體被消耗!

// 不好的實踐
$description = $_POST['description'];
echo $description;

// 好的實踐
 echo $_POST['description'];

4.10 迴圈內部不要宣告變數

尤其是大變數,這好像不只是PHP裡面要注意的問題吧?

4.11 一定要對變數進行初始化

這裡的“初始化”指的是“宣告”。

當需要沒有初始化的變數,PHP直譯器會自動建立一個變數,但依靠這個特性來程式設計並不是一個好主意。

這會造成程式的粗糙,或者使程式碼變得另人迷惑。

因為你需要探尋這個變數是從哪裡開始被建立的。

另外,對一個沒有初始化的變數進行遞增操作要比初始化過的來得慢。

所以對變數進行初始化會是個不錯的主意。

5 陣列

5.1 用字串而不是陣列作為引數

如果一個函式既能接受陣列,又能接受簡單字元做為引數,那麼儘量用字元作為引數。

例如,字元替換函式,引數列表並不是太長,就可以考慮額外寫一段替換程式碼。

使得每次傳遞引數都是一個字元,而不是接受陣列做為查詢和替換引數。

5.2 陣列元素加引號

$row['id']$row[id]速度快7倍。

如果不帶引號,例如$a[name],那麼PHP會首先檢查有沒有define定義的name常量。

如果有,就用這個常量值作為陣列鍵值。如果沒有,再查詢鍵值為字串'name'的陣列元素。

多了一個查詢判斷的過程,所以建議養成陣列鍵名加引號的習慣。

正如上面字串部分所述,用'又比用"速度更快。

5.3 多維陣列操作

多維陣列儘量不要迴圈巢狀賦值。

5.4 迴圈用foreach

儘量用foreach代替whilefor迴圈,效率更高。

6 架構

6.1 壓縮輸出

在php.ini中開啟gzip壓縮:

zlib.output_compression = On
zlib.output_compression_level = (level)

level可能是1-9之間的數字,你可以設定不同的數字。

幾乎所有的瀏覽器都支援Gzip的壓縮方式,gzip可以降低80%的輸出.

付出的代價是,大概增加了10%的cpu計算量。

但是還是會賺到了,因為頻寬減少了,頁面載入會變得很快。

如果你使用apache,也可以啟用mod_gzip模組。

6.2 靜態化頁面

Apache/Nginx解析一個PHP指令碼的時間,要比解析一個靜態HTML頁面慢210倍。

所以儘量使頁面靜態化,或使用靜態HTML頁面。

6.3 將PHP升級到最新版

提高效能的最簡單的方式是不斷升級、更新PHP版本。

6.4 利用PHP的擴充套件

一直以來,大家都在抱怨PHP內容太過繁雜。

最近幾年來,開發人員作出了相應的努力,移除了專案中的一些冗餘特徵。

即便如此,可用庫以及其它擴充套件的數量還是很可觀。

甚至一些開發人員開始考慮實施自己的擴充套件方案。

6.5 PHP快取

一般情況下,PHP指令碼被PHP引擎編譯後執行,會被轉換成機器語言,也稱為操作碼。

如果PHP指令碼反覆編譯得到相同的結果,為什麼不完全跳過編譯過程呢?

PHP加速器快取了編譯後的機器碼,允許程式碼根據要求立即執行,而不經過繁瑣的編譯過程。

對PHP開發人員而言,目前提供了兩種可用的快取方案。

一種是APC(Alternative PHP Cache,可選PHP快取),它是一個可以通過PEAR安裝的開源加速器。

另一種流行的方案是OPCode,也就是操作碼快取技術。

6.6 使用NoSQL快取

Memchached或者Redis都可以。

這些是高效能的分散式記憶體物件快取系統,能提高動態網路應用程式效能,減輕資料庫的負擔。

這對運算碼 (OPcode)的快取也很有用,使得指令碼不必為每個請求重新編譯。

相關文章