好像部落格有觀眾,那每一篇都畫個圖吧!
本節簡圖如下。
上一篇其實啥也沒講,不過node本身就是這麼複雜,走流程就要走全套。就像曾經看webpack原始碼,讀了300行程式碼最後就為了取package.json裡面的main屬性,導致我直接棄坑了,垃圾原始碼看完對腦子沒一點好處。回頭看了我之前那篇部落格,同步那塊講的還像回事,非同步就慘不忍睹了。不過講道理,非同步中涉及鎖、底層作業系統API(iocp)的部分我到現在也不太懂,畢竟沒有實際的多執行緒開發經驗,只是純粹的技術愛好者。
這一篇再次進入libuv內部,從uv_fs_stat開始,作業系統以windows為準,方法原始碼如下。
// 引數分別為事件輪詢物件loop、管理事件處理的物件req、路徑path、事件回撥cb int uv_fs_stat(uv_loop_t* loop, uv_fs_t* req, const char* path, uv_fs_cb cb) { int err; INIT(UV_FS_STAT); err = fs__capture_path(req, path, NULL, cb != NULL); if (err) { return uv_translate_sys_error(err); } POST; }
其實Unix版本的程式碼更簡潔,直接就是
int uv_fs_stat(uv_loop_t* loop, uv_fs_t* req, const char* path, uv_fs_cb cb) { INIT(STAT); PATH; POST; }
問題不大,都是三步。
前面兩步在那篇都有介紹,這裡就不重複了。大概就是根據操作型別初始化req物件,然後處理一下路徑,分配合理的空間給path字串這些。
重點還是放在POST巨集。
#define POST \ do { \ if (cb != NULL) { \ uv__req_register(loop, req); \ // word_req是一個型別為uv__work的結構體 // UV__WORK_FAST_IO是I/O操作型別 // uv__fs_work是一個函式 // uv__fs_done也是一個函式 uv__work_submit(loop, \ &req->work_req, \ UV__WORK_FAST_IO, \ uv__fs_work, \ uv__fs_done); \ return 0; \ } else { \ uv__fs_work(&req->work_req); \ return req->result; \ } \ } \ while (0)
由於只關注非同步操作,所以看if分支。引數已經在註釋中給出,還需要注意的一個點是方法名,register、submit,即註冊、提交。意思是,非同步操作中,在這裡也不是執行I/O的地點,實際上還有更深入的地方,繼續往後面看。
uv__req_register這個就不看了,簡單講是把loop的active_handle++,每一輪輪詢結束後會檢測當前loop是否還有活躍的handle需要處理,有就會繼續跑,判斷標準就是active_handle數量是否大於0。
直接看下一步uv__work_submit。
// uv__word結構體 struct uv__work { void (*work)(struct uv__work *w); void (*done)(struct uv__work *w, int status); struct uv_loop_s* loop; void* wq[2]; }; // 引數參考上面 init_once是一個方法 void uv__work_submit(uv_loop_t* loop, struct uv__work* w, enum uv__work_kind kind, void (*work)(struct uv__work* w), void (*done)(struct uv__work* w, int status)) { uv_once(&once, init_once); w->loop = loop; w->work = work; w->done = done; post(&w->wq, kind); }
又是兩部曲,第一個uv_once如其名,這個方法只會執行一次,然後將loop物件和兩個方法掛在前面req的uv__work結構體上,最後呼叫post。
uv_once這個方法有點意思,本身跟stat操作本身毫無關係,只是對所有I/O操作做一個準備工作,所有的I/O操作都會預先調一下這個方法。windows、Unix系統的處理方式完全不同,這裡貼一貼程式碼,Unix不想看也看不懂,搞搞windows系統的。
void uv_once(uv_once_t* guard, void (*callback)(void)) { // 呼叫過方法此處ran為1 直接返回 if (guard->ran) { return; } uv__once_inner(guard, callback); } static void uv__once_inner(uv_once_t* guard, void (*callback)(void)) { DWORD result; HANDLE existing_event, created_event; // 建立或開啟命名或未命名的事件物件 created_event = CreateEvent(NULL, 1, 0, NULL); if (created_event == 0) { uv_fatal_error(GetLastError(), "CreateEvent"); } // 對&guard->event與NULL做原子比較 如果相等則將created_event賦予&guard->event // 返回第一個引數的初始值 existing_event = InterlockedCompareExchangePointer(&guard->event, created_event, NULL); // 如果第一個引數初始值為NULL 說明該執行緒搶到了方法第一次執行權利 if (existing_event == NULL) { /* We won the race */ callback(); result = SetEvent(created_event); assert(result); guard->ran = 1; } else { // ... } }
分塊來解釋一下上面的函式吧。
- libuv這裡直接跟作業系統通訊,在windows上需要藉助其自身的event模組來輔助非同步操作。
- 提前劇透一下,所有的I/O操作是呼叫獨立執行緒進行處理,所以這個uv_once會被多次呼叫,而多執行緒搶呼叫的時候有兩種情況;第一種最簡單,第一名已經跑完所有流程,將ran設定為1,其餘執行緒直接被擋在了uv_once那裡直接返回了。第二種就較為複雜,兩個執行緒同時接到了這個任務,然後都跑進了uv_once_inner中去了,如何保證引數callback只會被呼叫一次?這裡用上了windows內建的原子指標比較方法InterlockedCompareExchangePointer。何謂原子比較?這是隻有在多執行緒才會出現的概念,原子性保證了每次讀取變數的值都是根據最新資訊計算出來的,避免了多執行緒經常出現的競態問題,詳細文獻可以參考wiki。
- 只有第一個搶到了呼叫權利的執行緒才會進入if分支,之後呼叫callback方法,並設定event,那個SetEvent也是windowsAPI,有興趣自己研究去。
最後,所有的程式碼流向都為了執行callback,參數列明這是一個函式指標,無返回值無引數,叫init_once。
static void init_once(void) { #ifndef _WIN32 // 用32位系統的去買新電腦 // 略... #endif init_threads(); }
有意思咯,執行緒來了。
先表明,libuv中有一個非常關鍵的資料結構:佇列,在src/queue.h。很多地方(比如之前講輪詢的某一階段取對應的callback時)我雖然說的是連結串列,但實際上用的是這個,由於連結串列是佇列的超集,而且比較容易理解,總的來說也不算錯。說這麼多,其實是初始化執行緒池會用到很多queue的巨集,我不想講,後面會單獨開一篇說。
下面上程式碼。
static void init_threads(void) { unsigned int i; const char* val; uv_sem_t sem; // 執行緒池預設大小為4 nthreads = ARRAY_SIZE(default_threads); // 可以通過環境變數UV_THREADPOOL_SIZE來手動設定 val = getenv("UV_THREADPOOL_SIZE"); // 如果設成0會變成1 大於上限會變成128 if (val != NULL) nthreads = atoi(val); if (nthreads == 0) nthreads = 1; if (nthreads > MAX_THREADPOOL_SIZE) nthreads = MAX_THREADPOOL_SIZE; threads = default_threads; // 分配空間 靜態變數threads負責管理執行緒 if (nthreads > ARRAY_SIZE(default_threads)) { threads = uv__malloc(nthreads * sizeof(threads[0])); if (threads == NULL) { nthreads = ARRAY_SIZE(default_threads); threads = default_threads; } } // 這裡是鎖和QUEUE相關... // 這裡給執行緒設定任務 喚醒後直接執行worker方法 for (i = 0; i < nthreads; i++) if (uv_thread_create(threads + i, worker, &sem)) abort(); // 無關程式碼... }
除去一些不關心的程式碼,剩下的就是判斷是否有手動設定執行緒池數量,然後初始化分配空間,最後迴圈給每一個執行緒分配任務。
這個worker可以先簡單看一下,大部分內容都是QUEUE相關,詳細內容全部寫在註釋裡面。
static void worker(void* arg) { // ... // 這個是給程式碼塊加鎖 很多地方都有 uv_mutex_lock(&mutex); for (;;) { // ..。 // 從佇列取出一個節點 q = QUEUE_HEAD(&wq); // 表示沒有更多要處理的資訊 直接退出絕不能繼續走下面的 // 退出前還會兩個操作 1.喚醒另一個執行緒再次處理這個方法(可能下一瞬間來活了) 2.去掉鎖 if (q == &exit_message) { uv_cond_signal(&cond); uv_mutex_unlock(&mutex); break; } // 從佇列中移除這個節點 QUEUE_REMOVE(q); QUEUE_INIT(q); is_slow_work = 0; // node過來的都是快速通道 不會走這裡 if (q == &run_slow_work_message) { //... } // 由於已經從佇列中移除了對應節點 這裡可以把鎖去掉了 uv_mutex_unlock(&mutex); // 從節點取出對應的任務 執行work也就是實際的I/O操作(比如fs.stat...) 參考上面的uv__work_submit方法 w = QUEUE_DATA(q, struct uv__work, wq); w->work(w); // 這裡也需要加鎖 執行完節點任務後需要將結果新增到word_queue的佇列中 uv_mutex_lock(&w->loop->wq_mutex); w->work = NULL; QUEUE_INSERT_TAIL(&w->loop->wq, &w->wq); uv_async_send(&w->loop->wq_async); uv_mutex_unlock(&w->loop->wq_mutex); // 由於是for(;;) 這裡加鎖純粹是為了下一次提前準備迴圈 uv_mutex_lock(&mutex); if (is_slow_work) { /* `slow_io_work_running` is protected by `mutex`. */ slow_io_work_running--; } } }
注意是靜態方法,所以也需要處理多執行緒問題。註釋我寫的非常詳細了,可以慢慢看,不懂C++也大概能明白流程。
還以為這一篇能搞完,沒想到這個流程有點長,先這樣吧。