關於PHP協程與阻塞的思考

kumfo發表於2019-02-16

程式、執行緒、協程

關於程式、執行緒、協程,有非常詳細和豐富的部落格或者學習資源,我不在此做贅述,我大致在此介紹一下這幾個東西。

  1. 程式擁有自己獨立的堆和棧,既不共享堆,亦不共享棧,程式由作業系統排程。
  2. 執行緒擁有自己獨立的棧和共享的堆,共享堆,不共享棧,執行緒亦由作業系統排程(標準執行緒是的)。
  3. 協程和執行緒一樣共享堆,不共享棧,協程由程式設計師在協程的程式碼裡顯示排程。

PHP中的協程實現基礎 yield

yield的根本實現是生成器類,而迭代器類是迭代器介面的實現:

Generator implements Iterator {
    public mixed current ( void ) // 返回當前產生的值
    public mixed key ( void ) // 返回當前產生的鍵
    public void next ( void ) // 生成器繼續執行
    public void rewind ( void ) // 重置迭代器,如果迭代已經開始了,這裡會丟擲一個異常。
                                             // renwind的執行將會導致第一個yield被執行, 並且忽略了他的返回值.
    public mixed send ( mixed $value ) // 向生成器中傳入一個值,並且當做 yield 表示式的結果,然後繼續執行生成器。如果當這個方法被呼叫時,生成器   
                                            // 不在 yield 表示式,那麼在傳入值之前,它會先執行到第一個 yield 表示式。
    public void throw ( Exception $exception ) // 向生成器中拋入一個異常
    public bool valid ( void ) // 檢查迭代器是否被關閉
    public void __wakeup ( void ) // 序列化回撥,丟擲一個異常以表示生成器不能被序列化。
}

以上解析可以參考PHP官方文件。

http://php.net/manual/zh/clas…

以及鳥哥翻譯的這篇詳細文件:

http://www.laruence.com/2015/…

我就以他實現的協程多工排程為基礎做一下例子說明並說一下關於我在阻塞方面所做的一些思考。

自定義簡單定時執行任務示例:

(此例子必須依賴於以上鳥哥實現的協程排程程式碼)



class timer {
    private $start = 0; // 定時開始時間
    private $timer; // 間隔的時間差,單位秒
    private $value = 0; // 產生的結果值
    private $callback; // 非同步回撥
    private $isEnd = false; // 當前定時器任務是否結束
    public function __construct($timer,callable $callback)
    {
        $this->start = time();
        $this->timer = $timer;
        $this->callback = $callback;
    }
    public function run() {
        if($this->valid()) {
            $callback = $this->callback;
            $callback($this->value ++,$this);
            $this->start = time();
        }
    }
    /**
     * 定時執行檢查
     */
    public function valid() {
        $end = time();
        if($end - $this->start >= $this->timer) {
            return true;
        } else {
            return false;
        }
    }
    public function setEnd($isEnd) {
        $this->isEnd = $isEnd;
    }
    public function getEnd() {
        return $this->isEnd;
    }
}

/**
 * 模擬阻塞的協程1
 *
 */
function taskObject1() {
    $timer = new timer(1,function($value,timer $timer) {
        if($value >= 5) {
            $timer->setEnd(true);
        }
        echo `<br>`.`A `.$value;
    });
    $tid = (yield getTaskId());
    while (true) {
        if($timer->getEnd() == true) {
            break;
        }
        yield $timer->run();
    }
}
/**
 * 模擬阻塞的協程2
 *
 */
function taskObject2() {
    $timer = new timer(2,function($value,timer $timer) {
        if($value >= 3) {
            $timer->setEnd(true);
        }
        echo `<br>`.`B `.$value;
    });
    $tid = (yield getTaskId());
    while (true) {
        if($timer->getEnd() == true) {
            break;
        }
        yield $timer->run();
    }
}
$scheduler = new Scheduler;
$scheduler->newTask(taskObject1());
$scheduler->newTask(taskObject2());
$scheduler->run();

以上實現的是:

  1. 產生兩個任務,並行執行,並且給每個任務在執行的時候模擬幾秒鐘的阻塞;
  2. 讓協程切換的時候能順利切換,其中的任務阻塞不相互影響;

思考:

我為什麼要做以上這件事情呢?因為我發現協程實現雖然很強大也很有意思,能讓多工並行,但是我在其中一個任務裡呼叫系統函式 sleep() 的時候,阻塞任務會阻止協程切換,其實從協程的實現原理上來說也是這麼回事。

那麼,我也就想模擬協程阻塞,但是不產生阻塞看是否可行。PHP本身只提供了生成器為協程呼叫提供了支撐,如果不依賴擴充套件,沒有提供多執行緒的程式實現方式,沒有java那麼強大,可以開子執行緒進行實現。

我印象中java的子執行緒是獨立執行且不會相互阻塞的,所以我在想,PHP既然可以實現類似於多執行緒這樣的機制,那麼能不能實現呼叫過程中非阻塞呢?

經過這樣一個實現和思考,一開始是陷入了一個誤區的,是由於PHP原生函式 sleep() 阻塞造成的思維誤區,那就是認為要想真正實現非阻塞或者說實現非同步的話,是必須依賴於語言底層的。

後來,我想明白了一個道理,既然某個方法或者函式在執行過程中,會產生阻塞,那麼把當前這個方法換成自定義的,做成非阻塞(相對於整個協程排程來說)不就行了嗎?比如上面的定時執行我自己實現了一個。

而另一方面,協程排程本身的目的也是為了把任務執行過程切成儘量小片,從而快速切換執行,達到並行的目的。從這方面來看,協程應該也算是一種程式設計思想。

以下是一個程式切成儘量小片執行的例子:

// 一個簡單的例子
<?php
function xrange($start, $end, $step = 1) {
    for ($i = $start; $i <= $end; $i += $step) {
        yield $i;
    }
}
 
foreach (xrange(1, 1000000) as $num) {
    echo $num, "
";
}

這個例子是把原本用 range 生成一個很大的整型陣列的方式切換為分片執行,也就是說在遍歷的時候再去取到指定的值,從程式碼上來看,記憶體消耗相對於之前來說就非常小了。

相關文章