從頭造輪子:python3 asyncio之 sleep (4)

wilson排球發表於2022-03-10

前言

書接上文:,本文造第四個輪子,也是asyncio包裡面非常常用,並且非常複雜的一個函式sleep

一、知識準備

time.sleep直接讓當前執行緒睡覺,但是這種方式顯然是不能接受的,如果當前執行緒睡覺,那我們所有的協程任務都會被卡主,併發也就無從談起了
● 理解socket.socketpair()建立的套接字物件
● 理解selectors的應用
● 理解最小堆以及heapq的應用
● 理解物件比較
● 這一小結的基礎知識很多,希望大家優先了解上述的知識再開始閱讀,否則很容易不知所云


二、環境準備

元件 版本
python 3.7.7

三、sleep的實現

先來看下官方sleep的使用方法:

|># more main.py
import asyncio

async def hello():
    print('enter hello ...')
    await asyncio.sleep(5)
    print('hello sleep end...')
    return 'return hello...'

async def world():
    print('enter world ...')
    await asyncio.sleep(3)
    print('world sleep end...')
    return 'return world...'

async def helloworld():
    print('enter helloworld')
    ret = await asyncio.gather(hello(), world())
    print('exit helloworld')
    return ret


if __name__ == "__main__":
    ret = asyncio.run(helloworld())
    print(ret)
    
|># time python3 main.py
enter helloworld
enter hello ...
enter world ...
world sleep end...
hello sleep end...
exit helloworld
['return hello...', 'return world...']

real	0m5.256s
user	0m0.077s
sys	0m0.020s

來看下造的輪子的使用方式:

▶ more main.py
async def hello():
    print('enter hello ...')
    await wilsonasyncio.sleep(5)
    print('hello sleep end...')
    return 'return hello...'

async def world():
    print('enter world ...')
    await wilsonasyncio.sleep(3)
    print('world sleep end...')
    return 'return world...'

async def helloworld():
    print('enter helloworld')
    ret = await wilsonasyncio.gather(hello(), world())
    print('exit helloworld')
    return ret

    
if __name__ == "__main__":
    ret = wilsonasyncio.run(helloworld())
    print(ret)

    
▶ time python3 main.py
enter helloworld
enter hello ...
enter world ...
world sleep end...
hello sleep end...
exit helloworld
['return hello...', 'return world...']
python3 main.py  0.06s user 0.04s system 1% cpu 5.406 total

都是用了5s左右,自己造的輪子也很好的執行了,下面我們來看下輪子的程式碼

四、程式碼解析

輪子程式碼

1)程式碼組成

|># tree
.
├── eventloops.py 
├── futures.py
├── main.py
├── tasks.py
├── wilsonasyncio.py
檔案 作用
eventloops.py 事件迴圈
futures.py futures物件
tasks.py tasks物件
wilsonasyncio.py 可呼叫方法集合
main.py 入口

2)程式碼概覽:

eventloops.py

類/函式 方法 物件 作用 描述
Eventloop 事件迴圈,一個執行緒只有執行一個
__init__ 初始化兩個重要物件 self._readyself._stopping
self._ready 所有的待執行任務都是從這個佇列取出來,非常重要
self._scheduled 待排程的任務佇列,這個佇列的任務會在合適的時機進入self._ready 新增
self._stopping 事件迴圈完成的標誌
current_time 從執行緒啟動到現在經歷的秒數 新增
call_later 呼叫該方法會經歷一個延時delay之後,再將任務新增到待執行佇列 新增
call_at 呼叫該方法會在指定的時間將任務新增到待執行佇列 新增
call_soon 呼叫該方法會立即將任務新增到待執行佇列
run_once run_forever呼叫,從self._ready佇列裡面取出任務執行 重新改造,新增了大量邏輯
run_forever 死迴圈,若self._stopping則退出迴圈
run_until_complete 非常重要的函式,任務的起點和終點(後面詳細介紹)
create_task 將傳入的函式封裝成task物件,這個操作會將task.__step新增到__ready佇列
create_future 返回Future物件 新增
Handle 所有的任務進入待執行佇列(Eventloop.call_soon)之前都會封裝成Handle物件
__init__ 初始化兩個重要物件 self._callbackself._args
self._callback 待執行函式主體
self._args 待執行函式引數
_run 待執行函式執行
TimerHandle 帶時間戳的物件 新增
__init__ 初始化重要物件 self._when 新增
self._when 排程的時間 新增
__lt__``__gt__``__eq__ 一系列魔術方法,實現物件比較 新增
get_event_loop 獲取當前執行緒的事件迴圈
fake_socket 建立一對套接字物件,並且將一種一條套接字註冊到多路複用物件sel,返回sel 新增
_complete_eventloop 將事件迴圈的_stopping標誌置位True
run 入口函式
gather 可以同時執行多個任務的入口函式
_GatheringFuture 將每一個任務組成列表,封裝成一個新的類
sleep 入口函式 新增

tasks.py

類/函式 方法 物件 作用 描述
Task 繼承自Future,主要用於整個協程執行的週期
__init__ 初始化物件 self._coro ,並且call_soonself.__step加入self._ready佇列
self._coro 使用者定義的函式主體
__step Task類的核心函式
__wakeup 喚醒任務
ensure_future 如果物件是一個Future物件,就返回,否則就會呼叫create_task返回,並且加入到_ready佇列

futures.py

類/函式 方法 物件 作用 描述
Future 主要負責與使用者函式進行互動
__init__ 初始化兩個重要物件 self._loopself._callbacks
self._loop 事件迴圈
self._callbacks 回撥佇列,任務暫存佇列,等待時機成熟(狀態不是PENDING),就會進入_ready佇列
add_done_callback 新增任務回撥函式,狀態_PENDING,就虎進入_callbacks佇列,否則進入_ready佇列
set_result 獲取任務執行結果並儲存至_result,將狀態置位_FINISH,呼叫__schedule_callbacks
__schedule_callbacks 將回撥函式放入_ready,等待執行
result 獲取返回值
__await__ 使用await就會進入這個方法
__iter__ 使用yield from就會進入這個方法
set_result_unless_cancelled 其實就是Future.set_result,只不過呼叫場景與呼叫方式不一樣 新增

新加了很多的函式,後面我們邊走流程,邊講解他們的用途

3)執行過程

3.1)入口函式

main.py

    
if __name__ == "__main__":
    ret = wilsonasyncio.run(helloworld())
    print(ret)

3.2)事件迴圈啟動,同gather,不再贅述

3.3)第一次迴圈run_forever --> run_once,同gather,不再贅述

3.3.1)gather完成,回到helloworld(),同gather,不再贅述

3.4)第二次迴圈run_forever --> run_once,從這裡開始,不一樣的地方來了

  • 從佇列中取出資料,此時_ready佇列有兩個任務,hello() world(),在gather的for迴圈時新增的
    def run_once(self):
        timeout = 0
        if not self._ready and self._scheduled:
            heapq.heapify(self._scheduled)
            when = self._scheduled[0]._when
            timeout = min(max(0, when - self.current_time()), 60)
        self._selector.select(timeout)

        end_time = self.current_time()
        while self._scheduled:
            handle = self._scheduled[0]
            if handle._when >= end_time:
                break
            handle = heapq.heappop(self._scheduled)
            self._ready.append(handle)
        

        ntodo = len(self._ready)
        for _ in range(ntodo):
            handle = self._ready.popleft()
            handle._run()
  • run_once做了改動,由於if not self._ready and self._scheduled不滿足(self._ready有內容)
  • timeout=0self._selector.select(timeout)不會等待,直接跳過
  • while self._scheduled不滿足,不會進入while迴圈
  • 直接進入handle._run()階段

上述的函式都沒有執行,所以沒有分析,在後面執行的時候會詳細分析作用

tasks.py

    def __step(self, exc=None):
        coro = self._coro
        try:
            if exc is None:
                result = coro.send(None)
            else:
                result = coro.throw(exc)
        except StopIteration as exc:
            super().set_result(exc.value)
        else:
            blocking = getattr(result, '_asyncio_future_blocking', None)
            if blocking:
                result._asyncio_future_blocking = False
                result.add_done_callback(self.__wakeup, result)
        finally:
            self = None
  • 經過coro.send(None)回到各自的函式本體中
async def hello():
    print('enter hello ...')
    await wilsonasyncio.sleep(5)
    return 'return hello...'

async def world():
    print('enter world ...')
    await wilsonasyncio.sleep(3)
    return 'return world...'
  • 由於hello() world()使用await呼叫了sleep,我們開看看sleep的原始碼:
async def sleep(delay, result=None, *, loop=None):
    if loop is None:
        loop = get_event_loop()
    future = loop.create_future()
    loop.call_later(delay, set_result_unless_cancelled, future, result)
    return await future
  • future = loop.create_future()建立了一個Future物件,隨後呼叫call_later
    def call_later(self, delay, callback, *args):
        timer = self.call_at(self.current_time() + delay, callback, *args)
        return timer

    def call_at(self, when, callback, *args):
        timer = TimerHandle(when, callback, *args)
        heapq.heappush(self._scheduled, timer)
        return timer
  • call_later call_at,主要的邏輯:
            a) self.current_time()獲取當前的時間線,再加上傳入的delayhello(5)``world(3))計算出延時
            b) timer = TimerHandle(when, callback, *args)將延時、callback(即set_result_unless_cancelled)再加上引數封裝成TimerHandle物件
            c) heapq.heappush(self._scheduled, timer)將物件推入self._scheduled 佇列等待合適的時間排程到self._ready
            d) 第一點需要注意的是,self._scheduled 是一個最小堆
            e) 第二點需要注意的是,TimerHandle 實現了__lt__ __gt__ __eq__,所以會通過self._when 進行物件比較。在本例中,hello()的延時是current_time+5,world()的延時是current_time+3,所以world()會優先排程

  • 返回到sleep

async def sleep(delay, result=None, *, loop=None):
    if loop is None:
        loop = get_event_loop()
    future = loop.create_future()
    loop.call_later(delay, set_result_unless_cancelled, future, result)
    return await future
  • return await futuregather小節中描述過,一旦呼叫了await,就會來到__await__
    def __await__(self):
        if self._state == _PENDING:
            self._asyncio_future_blocking = True
            yield self
        return self.result()
  • yield self self就是之前建立的future物件,並且返回到當初send的地方,對的,就是Task.__step裡面
    def __step(self, exc=None):
        coro = self._coro
        try:
            if exc is None:
                result = coro.send(None)
            else:
                result = coro.throw(exc)
        except StopIteration as exc:
            super().set_result(exc.value)
        else:
            blocking = getattr(result, '_asyncio_future_blocking', None)
            if blocking:
                result._asyncio_future_blocking = False
                result.add_done_callback(self.__wakeup, result)
        finally:
            self = None
  • 由於他們去__await__溜達了一圈,所以_asyncio_future_blocking=True,所以hello() world()的回撥函式是self.__wakeup

  • 這一次迴圈結束了,hello() world()並沒有結束,而是分分掛起,等待他們的子任務await wilsonasyncio.sleep執行結束完之後才會喚醒

3.5)第三次迴圈run_forever --> run_once

eventloops:

    def run_once(self):
        timeout = 0
        if not self._ready and self._scheduled:
            heapq.heapify(self._scheduled)
            when = self._scheduled[0]._when
            timeout = min(max(0, when - self.current_time()), 60)
        self._selector.select(timeout)

        end_time = self.current_time()
        while self._scheduled:
            handle = self._scheduled[0]
            if handle._when >= end_time:
                break
            handle = heapq.heappop(self._scheduled)
            self._ready.append(handle)
        

        ntodo = len(self._ready)
        for _ in range(ntodo):
            handle = self._ready.popleft()
            handle._run()
  • run_once函式進行了改造
  • self._ready為空,並且self._scheduled佇列不為空,裡面的內容是hello() world()2個函式中呼叫await wilsonasyncio.sleep()時新增進self._scheduled,分別是兩個TimerHandle物件,並且是按照最小堆排序
  • 由於是按照最小堆排序,直接取出來肯定就是時間最小的,timeout = min(max(0, when - self.current_time()), 60),獲取timeout
  • self._selector.select(timeout)核心程式碼,主要的邏輯就會等待timeout的時間,是整個執行緒等待,所有的協程任務都會卡主,但是當前佇列裡面所有的任務都是等待,並且當前的timeout是等待時間最小的。在本例中,timeout就是world()的等待時間:3s

self._selector.select(timeout) 這裡要詳細描述一下了

  • 核心邏輯就是將一堆等待中的協程任務中,選一個等待時間最小的出來,然後執行緒sleep
  • 這時的sleep可以用粗暴的time.sleep,但是我們選擇了self._selector.select(timeout),主要_selector在後面的應用中發揮了巨大的作用,只是在這裡看不出來
  • self._selector是一個多路複用物件,就是我們熟悉的select() poll() epoll(),我們將一條socket註冊到物件上面,然後呼叫self._selector.select(timeout),整個執行緒就會在timeout期間,監聽socket是否有新的資料,一旦socket有新的資料,就會立即執行回撥函式
  • 那socket物件是怎麼來的,event_loop初始化的時候,會通過socket.socketpair()建立一對socket,並且把它註冊進self._selector,所以self._selector.select(timeout)會監聽socket是否有讀寫事件
  • sel.register(_ssock.fileno(), selectors.EVENT_READ, None)當然,我們的回撥函式是None,沒有註冊任何回撥,在本例中,我們只需要它的等待功能
  • 肯定會有人問了,那如果這時候出現了一個需要立即執行的任務,怎麼辦?這是後面解答的問題,在後面的輪子中肯定會解答這個問題,而在本例中,不可能會出現這種情況(如果是立即執行的任務,那麼一定出現在self._ready佇列裡面,在第一次迴圈就已經執行完成了)

簡單解釋了一下,我們喝一口水,繼續。。。

  • end_time = self.current_time()記錄一下當前的時間
        while self._scheduled:
            handle = self._scheduled[0]
            if handle._when >= end_time:
                break
            handle = heapq.heappop(self._scheduled)
            self._ready.append(handle)
  • _when大於當前時間的協程任務取出來,放入self._ready佇列,等待下一次迴圈排程
  • _when小於當前事件的協程任務留在self._scheduled ,他們還需要繼續睡覺
  • 全部搞完,繼續往下走
        ntodo = len(self._ready)
        for _ in range(ntodo):
            handle = self._ready.popleft()
            handle._run()
  • 熟悉的流程,handleworld()sleep,執行其回撥函式set_result_unless_cancelled,就是set_result
  • __wakeup加入到self._ready佇列,world()等待被喚醒

3.6)第四次迴圈run_forever --> run_once

if not self._ready and self._scheduled:
  • timeout=0, self._ready有協程任務,不會等待
  • __wakeup --> __step --> send(None) --> 回到 world()
async def world():
    print('enter world ...')
    await wilsonasyncio.sleep(3)
    print('world sleep end...')
    return 'return world...'
  • world()協程完成,將回撥_done_callback加入到self._ready佇列,同gather

3.7)第五次迴圈run_forever --> run_once

  • gather._done_callback(),由於條件不滿足,不會新增回撥到self._ready,同gather

3.8)第六次迴圈run_forever --> run_once

        if not self._ready and self._scheduled:
            heapq.heapify(self._scheduled)
            when = self._scheduled[0]._when
            timeout = min(max(0, when - self.current_time()), 60)
  • timeout = min(max(0, when - self.current_time()), 60),由於剛才等了3s,hello()delay是5s,所以這裡timeout=2(這之間還有很多程式碼的執行時間,不過執行速度非常快)

  • self._selector.select(timeout)等待2s之後,重複了world()的流程

  • handlehello()sleep,執行其回撥函式set_result_unless_cancelled,就是set_result

  • __wakeup加入到self._ready佇列,hello()等待被喚醒

  • results.append(res)將子任務的結果取出來,放進父任務的results裡面

  • 子任務執行完成,終於到了喚醒父任務的時候了task.__wakeup

    def __wakeup(self, future):
        try:
            future.result()
        except Exception as exc:
            raise exc
        else:
            self.__step()
        self = None

3.8)第七次迴圈run_forever --> run_once

  • __wakeup --> __step --> send(None) --> 回到 hello()
async def hello():
    print('enter hello ...')
    await wilsonasyncio.sleep(5)
    print('hello sleep end...')
    return 'return hello...'
  • hello()協程完成,將回撥_done_callback加入到self._ready佇列,同gather

3.9)第八次迴圈run_forever --> run_once

  • gather._done_callback(),由於條件滿足,將回撥到self._readyhelloworld等待被喚醒。同上一小節gather

3.10)第九次迴圈run_forever --> run_once

  • 迴圈結束
  • 回到run

3.11)回到主函式,獲取返回值

if __name__ == "__main__":
    ret = wilsonasyncio.run(helloworld())
    print(ret)

3.12)執行結果

▶ python3 main.py
enter helloworld
enter hello ...
enter world ...
world sleep end...
hello sleep end...
exit helloworld
['return hello...', 'return world...']

五、流程總結

六、小結

● 無法總結。。。。有問題私信、留言
● 本文中的程式碼,參考了python 3.7.7中asyncio的原始碼,裁剪而來
● 本文中程式碼:程式碼



至此,本文結束
在下才疏學淺,有撒湯漏水的,請各位不吝賜教...
更多文章,請關注我:wilson.chai

相關文章