PHP的記憶體洩露問題與垃圾回收

範長法@三月軟體發表於2014-12-25

你寫了一個PHP指令碼,一般都不用考慮記憶體洩露和垃圾回收的問題,因為一般情況下你的指令碼很快就執行完退出了。

但在一些執行時間長,資料量大的時候,程式執行一段時間後,php指令碼就佔用了過多記憶體,然後就報錯(PHP Fatal error: Allowed memory size of 134217728 bytes exhausted)退出了。一般來說,每個頁面處理結束,新建的simple_html_dom物件就應該被銷燬了——但是實際上沒有,很明顯,記憶體洩露發生了。

 

PHP的垃圾回收機制

PHP5.3之前使用的垃圾回收機制是單純的“引用計數”,也就是每個記憶體物件都分配一個計數器,當記憶體物件被變數引用時,計數器+1;當變數引用撤掉後,計數器-1;當計數器=0時,表明記憶體物件沒有被使用,該記憶體物件則進行銷燬,垃圾回收完成。

“引用計數”存在問題,就是當兩個或多個物件互相引用形成環狀後,記憶體物件的計數器則不會消減為0;這時候,這一組記憶體物件已經沒用了,但是不能回收,從而導致記憶體洩露。

PHP5.3開始,使用了新的垃圾回收機制,在引用計數基礎上,實現了一種複雜的演算法,來檢測記憶體物件中引用環的存在,以避免記憶體洩露。

 

檢視記憶體是否洩露

看是否有該釋放的記憶體沒有被釋放,可以簡單的通過 呼叫  memory_get_usage  函式檢視記憶體使用情況來判斷;memory_get_usage 函式返回的記憶體使用資料據說不是很準確,可以使用  php 的 xdebug 擴充套件來獲得更準確翔實的記憶體使用情況。

class A{
    private $b;
    function __construct(){
        $this->b = new B($this);
    }
    function __destruct(){
        //echo "A destruct\n";
    }
}

class B{
    private $a;
    function __construct($a){
        $this->a = $a;
    }
    function __destruct(){
        //echo "B descturct\n";
    }
}

for($i=0;;$i++){
    $a = new A();
    if($i00 == 0){
        echo memory_get_usage()."\n";
    }
}

上面就構造了一個會產生環狀引用的例子。每次建立一個A物件的例項a,a就建立一個B物件的例項b,同時讓b引用a。這樣,每個A物件永遠被一個B引用,而每個B物件同時被一個物件A引用,引用環就這樣產生了。

在PHP5.2的環境下執行這段程式碼,會發現記憶體使用在單調上漲,也沒有A和B的解構函式被執行後輸出的“A/B desctruct”資訊;直到記憶體耗盡,輸出“PHP Fatal error:  Allowed memory size of 134217728 bytes exhausted (tried to allocate 40 bytes)”。

在PHP5.3的環境下執行這段程式碼,則發現記憶體使用在上跳下竄,但是永遠沒有超過一個限額。程式也會輸出大量的“A/B desctruct”,這說明解構函式被呼叫了。

我的同事的程式中,就存在這種引用的環路,而他的指令碼,實在php5.2.3下執行的。simple_html_dom工具中,有兩個類,分別是simple_html_dom和simple_html_dom_node,前者中有一個陣列成員變數nodes,陣列中每個元素都是一個simple_html_dom_node物件;而每個simple_html_dom_node物件都有一個成員變數dom,該dom的值就是前面的simple_html_dom物件——這樣就形成了一個漂亮的引用環,導致了記憶體洩露。解決的辦法也很簡單,就是simple_html_dom物件在使用完畢時,主動呼叫其clear函式,清空其成員變數nodes,環就被打破了,記憶體洩露也就不會發生了。

 

其他

1. 垃圾回收的時機

PHP中,引用計數為0,則記憶體立刻釋放。也就是說,不存在環狀引用的變數,離開變數的作用域,記憶體被立刻釋放。環狀引用檢測則是在滿足一定條件下觸發,所以在上面的例子中,會看到使用的記憶體有大幅度的波動。也可以通過 gc_collect_cycles 函式來主動進行環狀引用檢測。

2. &符號的影響

顯式引用一個變數,會增加該記憶體的引用計數:

$a = "something";
$b = &$a;

此時unset($a), 但是仍有$b指向該記憶體區域的引用,記憶體不會釋放。

3. unset函式的影響

unset只是斷開一個變數到一塊記憶體區域的連線,同時將該記憶體區域的引用計數-1;在上面的例子中,迴圈體內部,$a=new A(); unset($a);並不會將$a的引用計數減到零;

4. = null 操作的影響

$a = null 是直接將$a 指向的資料結構置空,同時將其引用計數歸0。

5. 指令碼執行結束的影響

指令碼執行結束,該指令碼中使用的所有記憶體都會被釋放,不論是否有引用環。

 

原文地址:http://blog.snsgou.com/post-181.html

相關文章