非同步程式設計需要“意識”

邊城發表於2018-02-23

雖然我們生活在一個非同步的世界裡,但對於多數程式設計初學者來說,非同步還是很陌生。學習一門程式語言,通常都是從同步流程開始的,即順序、分支和迴圈。而非同步流程是什麼呢——開始一個非同步呼叫,然後……就沒有然後了。非同步程式跑哪去了?

非同步程式會以某種非同步的形式在執行著,比如多執行緒、非同步IO等,直到處理完成。那如果需要處理結果怎麼辦?給一個程式入口,讓它處理完當前過程之後,把處理結果送到這個入口,然後執行另一段程式——俗稱回撥。回撥一般使用 callback 這個名稱,不過有時候我更喜歡使用 next,因為它代表著下一個處理步驟。

同步和非同步的概念

現在我們接觸到了一些概念,比如同步和非同步,它們是什麼?

這兩個概念並不來源於程式語言,而是來源於低層指令,甚至更低層的——電路。它們是基於時序的兩個概念,其中,“步”是指步調,所以同步表示相同的步調,而非同步表示不同的步調。當然這兩個概念提升到程式這個級別的時候,精確的意思與時鐘無關,但所表示的意義仍然未變。

同步

舉個生活中的例子來說明這個問題——排除買票。售票廳開了一個視窗,有一隊人在排隊依次買票。這個隊伍中,前面一個人往前走了一步,後面的人才能往前走一步;前面的人在等待,後面的人就一定在等待。那麼在理想的情況下,所有人可以同時向前邁步。OK,大家步伐一致,稱為同步。

這裡把售票視窗看作是處理器,每個人看作是等待執行的指令,買票這個動作就是在執行指令。它的特點是按步就班,如果一個人買票時間過長(指令執行時間過長),就會造成阻塞。

非同步(多執行緒)

現在買票的人漸漸多起來,所以售票廳多開了幾個視窗同時售票。每個單獨的隊伍仍然保持著同步,但不同的隊伍之間,步伐不再一致,稱為非同步。A 佇列售票很順利,隊伍在有序快速的前進,但 B 佇列的某個顧客似乎在付費時遇到點麻煩,花了很長的時候,造成阻塞,但這對 A 佇列並不產生影響。

這時候的售票廳可以看作是在以多執行緒的方式執行著非同步程式。從這個例子可以看到非同步的兩個特點:其一,兩個非同步流程之間相互獨立,它們相互不會阻塞(有個前提,不需要等待共享資源的情況下);其二,非同步程式內部仍然是同步的

非同步(IO)

上面的例子比較符合多執行緒非同步的情況。那 IO 非同步又是什麼樣呢?

年底了,M 在準備年終彙報的資料,這可是個緊張的工作(CPU),要收集不少資料來寫好些文案。為了其中一份文案,M 需要車間的生產資料,但跑一趟車間(IO)可需要花不少時間,所以他讓 N 去車間收集資料,自己則繼續寫其它方案,同時等 N 把資料收集回來(啟動非同步程式)。半天以後,N 帶回了資料(插入事件訊息),M 繼續完成手上的文案(完成當前事件迴圈),之後使用 N 帶回來的資料開始撰寫關於車間的報告(新的事件迴圈)……

IO 的處理速度比 CPU 慢得多,所以 IO 非同步讓 CPU 不必閒置著等待 IO 操作完成。當 IO 操作完成之後,CPU 會適地使用 IO 操作結果繼續工作。

同步邏輯和非同步邏輯

回到程式上來,我們以一個函式的處理過程來描述同步和非同步的處理方式。

同步邏輯

那麼,同步處理過程是:

接受輸入 ⇒ 處理 ⇒ 產生輸出
複製程式碼

用一段虛擬碼來描述就是

注:本文中的虛擬碼比較接近 JavaScript 語法,而有時候為了說明型別,採用了 TypeScript 的型別申明語法。

function func(input) {
    do something with input
    return output
}
複製程式碼

這是標準的 IPO(Input-Process-Output) 處理。

非同步邏輯

而非同步呢,是:

接受輸入 ⇒ 處理 ⇒ 啟動下一步(如果有)
複製程式碼

用虛擬碼來描述就是:

function asyncFunc(input, next) {
    do something with input
    if (next is a entry) {
        next(output)
    }
}
複製程式碼

這個過程稱為 IPN(Input-Process-Next)。

注意到這裡的 Next,下一步,只有一步。這一步,囊括了後續的若干步驟。所以這一步,只能是後續若干步驟封裝出來一個模組入口,或者說函式。

因此,模組化思想在非同步思維中是一個非常關鍵的思想。很多初學者寫程式碼喜歡像記流水賬一樣一句句往下寫,動不動就是成百上千行的函式,這就是一種缺乏模組化思想的表現。模組化思想需要訓練,分析程式碼的相關性,提煉函式,提取物件,在具有一定經驗之後還需要掌握模組細化的粒度平衡。這不是一朝一夕之功,不過我推薦看看“設計模式”和“重構”相關的書籍。

非同步開發工具(SDK和語法層面的)

承諾(Promise)

再想想上面關於年終彙報的例子,M 請 N 去車間收集資料的時候,N 會說:“好的,我很快就把資料帶回來”,這是一種承諾。基於這個承諾,M 才能安排後面撰寫關於車間的彙報材料。這個過程用虛擬碼來描述就是

function collectData(): Promise {
    // N 去收集資料,產生了一個承諾
    return new Promise(resolve => {
        collect data from workshop
        // 這個承諾最終會帶來資料
        resolve(data)
    })
}

function writeWorkshopReport(data) {
    write report with data
}

// 收集資料的承諾兌現之後,可將這個資料用於寫報告
collectData()
    .then(data => writeWorkshopReport(data))
複製程式碼

以 JavaScript 為代表的一些語言 SDK 中使用了 Promise。不過 C# 中是採用的 TaskTask<T>,相應的,使用了 Task.ContinueWithTask<T>.ContinueWith 來代替 Promise.then

非同步邏輯同步化

上面提到了同步思維和非同步思維在一個處理步驟中的區別。如果跳出一個處理步驟,從更大範圍的處理流程來看,非同步與同步其實也沒多大區別,都是 輸入-->處理-->產生輸出-->將輸出用於下一步驟,唯一要注意的是需要等待非同步處理產生的輸出,我們可以稱之為非同步等待。由於我們可以一邊進行非同步等待(async wait,簡寫 await),一邊做別的事情,所以這個等待並不產生阻塞。但是,由於宣告瞭這個等待,編譯器/直譯器會將後面的程式碼自動放在等待完成之後呼叫,這讓非同步程式碼寫起來就像寫同步程式碼一樣。

上面的例子使用非同步等待的虛擬碼會像這樣

async function collectData(): Promise {
    collect data from workshop
    // 多數語言會把 async 函式的返回值封裝成 Promise
    return data
}

function writeWorkshopReport(data) {
    write report with data
}

// await 只能用於宣告為 async 的函式中
async function main() {
    data = await collectData()
    writeWorkshopReport(data)
}

// 定義了非同步 main 函式,一定要記得呼叫,不然它是不會執行的
main()
複製程式碼

像 C# 和 JavaScript 等語言都從語法層面規定了 await 必須用在宣告為 async 的函式中,這就從編譯/解釋的層面限定了 await 的用途,只要使用了 await,那它所處的就一定是一個非同步上下文。而 async 也要求編譯器/直譯器對其返回值進行一些自動處理,比如在 JavaScript 中,其返回值如果不是 Promise 物件,它會自動封裝成一個 Promise 物件;而在 C# 中,它會自動封裝成 TaskTask<T>(所以 async 方法的型別需要宣告為 TaskTask<T>)。

注意,注意,注意

儘管語言服務在非同步程式同步化方面已經做了很多工作,但是仍然避免不了一些人為錯誤,比如忘記寫 await 關鍵字。在強型別語言中編譯器會檢查得嚴格一些,但如果是在 JavaScript 中,忘記寫 await 意味著原本應該取得一個值的語句,會取到一個 Promise。直譯器不會對此質疑,但程式執行的結果會不正確。

小結

總的來說,非同步程式設計並不是特別困難的事情。使用 async/await 語言特性甚至可以用類似編寫同步程式碼的方法來編寫非同步程式碼。但語法糖終究是糖,要想把非同步程式設計掌握得更好,還是需要去了解和熟悉非同步、回撥、Promise、模組化、設計模式、重構等概念。

相關閱讀

相關文章