PHP大量資料迴圈時記憶體耗盡問題的解決方案

webhek發表於2015-10-06

最近在開發一個PHP程式時遇到了下面的錯誤:

PHP Fatal error: Allowed memory size of 268 435 456 bytes exhausted

錯誤資訊顯示允許的最大記憶體已經耗盡。遇到這樣的錯誤起初讓我很詫異,但轉眼一想,也不奇怪,因為我正在開發的這個程式是要用一個foreach迴圈語句在一個有4萬條記錄的表裡全表搜尋具有特定特徵的資料,也就是說,一次要把4萬條資料取出,然後逐條檢查每天資料。可想而知,4萬條資料全部載入到記憶體中,記憶體不爆才怪。

畢竟程式設計這麼多年,我隱約記得PHP裡提供有非一次全部載入資料的API,是像處理流媒體那樣,隨用隨取隨丟、資料並不會積累在記憶體的查詢方法。經過簡單的搜尋,果然在官方網站上找到的正確的用法。

這個問題在PHP的官方網站上叫緩衝查詢和非緩衝查詢(Buffered and Unbuffered queries)。 PHP的查詢預設模式是緩衝模式。也就是說,查詢資料結果會一次全部提取到記憶體裡供PHP程式處理。這樣給了PHP程式額外的功能,比如說,計算行數,將 指標指向某一行等。更重要的是程式可以對資料集反覆進行二次查詢和過濾等操作。但這種緩衝查詢模式的缺陷就是消耗記憶體,也就是用空間換速度。

相對的,另外一種PHP查詢模式是非緩衝查詢,資料庫伺服器會一條一條的返回資料,而不是一次全部返回,這樣的結果就是PHP程式消耗較少的記憶體,但卻增加了資料庫伺服器的壓力,因為資料庫會一直等待PHP來取資料,一直到資料全部取完。

很顯然,緩衝查詢模式適用於小資料量查詢,而非緩衝查詢適應於大資料量查詢。

對於PHP的緩衝模式查詢大家都知道,下面列舉的例子是如何執行非緩衝查詢API。

非緩衝查詢方法一: mysqli

<?php 
$mysqli  = new mysqli("localhost", "my_user", "my_password", "world"); 
$uresult = $mysqli->query("SELECT Name FROM City", MYSQLI_USE_RESULT); 

if ($uresult) { 
   while ($row = $uresult->fetch_assoc()) { 
       echo $row['Name'] . PHP_EOL; 
   } 
} 
$uresult->close(); 
?>

非緩衝查詢方法二: pdo_mysql

<?php 
$pdo = new PDO("mysql:host=localhost;dbname=world", 'my_user', 'my_pass'); 
$pdo->setAttribute(PDO::MYSQL_ATTR_USE_BUFFERED_QUERY, false); 

$uresult = $pdo->query("SELECT Name FROM City"); 
if ($uresult) { 
   while ($row = $uresult->fetch(PDO::FETCH_ASSOC)) { 
       echo $row['Name'] . PHP_EOL; 
   } 
} 
?>

非緩衝查詢方法三: mysql

<?php 
$conn = mysql_connect("localhost", "my_user", "my_pass"); 
$db   = mysql_select_db("world"); 

$uresult = mysql_unbuffered_query("SELECT Name FROM City"); 
if ($uresult) { 
   while ($row = mysql_fetch_assoc($uresult)) { 
       echo $row['Name'] . PHP_EOL; 
   } 
} 
?>

相關文章