用PHP的生成器yield處理大量資料,確實很快!

php技術社群發表於2021-11-09

yield生成器是php5.5之後出現的,官方文件這樣解釋:yield提供了一種更容易的方法來實現簡單的迭代物件,相比較定義類實現 Iterator 介面的方式,效能開銷和複雜性大大降低。


生成器的核心是一個yield關鍵字,一個生成器函式看起來像一個普通的函式,不同的是:普通函式返回一個值,而一個生成器可以yield生成許多它所需要的值。生成器函式被呼叫時,返回的是一個可以被遍歷的物件。

yield和return有點類似,不過不同的是,return會返回值並且終止程式碼的執行,而yield會返回一個值給迴圈呼叫此生成器的程式碼並且只是暫停執行生成器函式。
 

這裡順便給大家介紹一下php版本的非緩衝查詢

意思即是 把資料一行行 讀取到php執行記憶體,並非一次性讀取到php執行記憶體,眾所周知,php有很多內建函式,可以幫助我們對資料進行加工操作,因為資料都在記憶體裡面,所以能操作,但是php的執行記憶體是有極限,預設128M。
注意:因為非緩衝查詢是 會長時間連線資料庫的,有可能會造成慢查詢、鎖表之類的情況,比較耗mysql資源
相對非緩衝查詢就是 緩衝查詢:
如果用快取查詢,php記憶體就會直接爆了,出現記憶體不足的情況。好了,這裡主要是為了突出yield
 

yield效能

  • 生成器會對PHP應用的效能有非常大的影響

  • PHP程式碼執行時節省大量的記憶體

  • 比較適合計算大量的資料


yield運用

生成器允許你在 foreach 程式碼塊中寫程式碼來迭代一組資料而不需要在記憶體中建立一個陣列,那會使你的記憶體達到上限,或者會佔據可觀的處理時間。相反,你可以寫一個生成器函式,就像一個普通的自定義函式一樣, 和普通函式只返回一次不同的是, 生成器可以根據需要 yield 多次,以便生成需要迭代的值。


例子講解

public function read_temp_api_order_info($number){
    for($i=1; $i <= $number; $i++){
        $temp_api_order_info = [
            'address' => "這裡是磊豐的測試地址:13號50".$i."室",
            'card_no' => "8888888711172157",
            'city' => "440300",
            'create_id' => 1,
            'create_name' => "zhuomaquan333",
            'created_at' => "2019-11-11 10:05:36",
            'customer_name' => "磊豐",
            'customer_phone' => "1008611",
            'dealer_id' => "111",
            'delivery_id' => 115,
            'dispatch_info' => "",
            'district' => "440306",
            'examine_id' => 1,
            'examine_name' => "zhuomaquan333",
            'goods' => [203 => 3],
            'order_id' => "D201911119000".$i,
            'order_status' => "14",
            'order_type' => 2,
            'province' => "440000",
            'remark' => null,
            'updated_at' => "",
            'ware_id' => "151",
        ];
        yield $temp_api_order_info;
    }
}


我這裡只是構建了一個陣列來給大家演示,平常你在運算元據庫輸出資料也是一樣的。轉為array

//倉庫庫存扣除測試
public function cangku_stock()
{
    //set_time_limit(0);  //表示永久執行,這裡我是測試array的時候用到的
    $order_info = $this->read_temp_api_order_info(10);  //這裡我就測試了10條資料,效果是看不出來的
    foreach($order_info as $temp_api_order_info){
        dd($temp_api_order_info);  //列印出來看看資料
        //處理資料
        $api_ware_id = $this->o->getCangkuApiUrl() .'ware/program/addOutWare';
        $out_wares = api_request($api_ware_id, $temp_api_order_info);
        $temp_out_wares = json_decode($out_wares, true);
        if ($temp_out_wares['code'] != 1) {
            $msg =  (isset($temp_out_wares['msg']) && $temp_out_wares['msg']) ? $temp_out_wares['msg'] : var_export($out_wares, true);
            throw new Exception($msg);
        }
    }
    //dd("批次更新成功".date('Y-m-d H:i:s'));
}

可以看到我們呼叫 $order_info = $this->read_temp_api_order_info(10);返回了一個 Generator 物件,這個物件可以使用 foreach 迭代,每次迭代,PHP 會要求 Generator 例項計算並提供下一個要迭代的值。


生成器的優雅體現在每次產出一個值之後,生成器的內部狀態都會停頓;向生成器請求下一個值時,內部狀態又會恢復。生成器內部的狀態會一直在停頓和恢復之間切換,直到抵達函式定義體的末尾或遇到空的 return 語句為止。


效果如下:


這裡測試大量資料,直接更改 $this->read_temp_api_order_info(10);就好,如果是計算資料表數量,那你就要改改這個方法了。自己試著更改一下吧。



這裡我主要給大家講解yield的用法,如果要看插入資料表用了多長時間,自己可以在資料表增加插入時間的欄位,再看看第一條資料插入與最後一條資料插入的時候的對比的。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70009696/viewspace-2841244/,如需轉載,請註明出處,否則將追究法律責任。

相關文章