IO - 同步非同步阻塞非阻塞的區別

智障大師發表於2018-05-12

　　同步（synchronous） IO和非同步（asynchronous） IO，阻塞（blocking） IO和非阻塞（non-blocking）IO分別是什麼，到底有什麼區別？

　　這個問題其實不同的人給出的答案都可能不同，比如wiki，就認為asynchronous IO和non-blocking IO是一個東西。這其實是因為不同的人的知識背景不同，並且在討論這個問題的時候上下文(context)也不相同。所以，為了更好的回答這個問題，我先限定一下本文的上下文。

　　本文討論的背景是Linux環境下的network IO。

　　本文最重要的參考文獻是Richard Stevens的“UNIX® Network Programming Volume 1, Third Edition: The Sockets Networking ”，6.2節“I/O Models ”，Stevens在這節中詳細說明了各種IO的特點和區別，如果英文夠好的話，推薦直接閱讀。Stevens的文風是有名的深入淺出，所以不用擔心看不懂。本文中的流程圖也是擷取自參考文獻。

　　Stevens在文章中一共比較了五種IO Model：

　　blocking IO
　　nonblocking IO
　　IO multiplexing
　　signal driven IO
　　asynchronous IO

　　由於signal driven IO在實際中並不常用，所以我這隻提及剩下的四種IO Model。

　　再說一下IO發生時涉及的物件和步驟。

　　對於一個network IO (這裡我們以read舉例)，它會涉及到兩個系統物件，一個是呼叫這個IO的process (or thread)，另一個就是系統核心(kernel)。當一個read操作發生時，它會經歷兩個階段：

　　1 等待資料準備 (Waiting for the data to be ready)

　　2 將資料從核心拷貝到程式中 (Copying the data from the kernel to the process)

　　記住這兩點很重要，因為這些IO Model的區別就是在兩個階段上各有不同的情況。

　　blocking IO

　　在linux中，預設情況下所有的socket都是blocking，一個典型的讀操作流程大概是這樣：

　　當使用者程式呼叫了recvfrom這個系統呼叫，kernel就開始了IO的第一個階段：準備資料。對於network io來說，很多時候資料在一開始還沒有到達（比如，還沒有收到一個完整的UDP包），這個時候kernel就要等待足夠的資料到來。而在使用者程式這邊，整個程式會被阻塞。當kernel一直等到資料準備好了，它就會將資料從kernel中拷貝到使用者記憶體，然後kernel返回結果，使用者程式才解除block的狀態，重新執行起來。
所以，blocking IO的特點就是在IO執行的兩個階段都被block了。

　　non-blocking IO

　　linux下，可以通過設定socket使其變為non-blocking。當對一個non-blocking socket執行讀操作時，流程是這個樣子：

　　從圖中可以看出，當使用者程式發出read操作時，如果kernel中的資料還沒有準備好，那麼它並不會block使用者程式，而是立刻返回一個error。從使用者程式角度講，它發起一個read操作後，並不需要等待，而是馬上就得到了一個結果。使用者程式判斷結果是一個error時，它就知道資料還沒有準備好，於是它可以再次傳送read操作。一旦kernel中的資料準備好了，並且又再次收到了使用者程式的system call，那麼它馬上就將資料拷貝到了使用者記憶體，然後返回。

　　所以，使用者程式其實是需要不斷的主動詢問kernel資料好了沒有。

　　IO multiplexing

　　IO multiplexing這個詞可能有點陌生，但是如果我說select，epoll，大概就都能明白了。有些地方也稱這種IO方式為event driven IO。我們都知道，select/epoll的好處就在於單個process就可以同時處理多個網路連線的IO。它的基本原理就是select/epoll這個function會不斷的輪詢所負責的所有socket，當某個socket有資料到達了，就通知使用者程式。它的流程如圖：

　　當使用者程式呼叫了select，那麼整個程式會被block，而同時，kernel會“監視”所有select負責的socket，當任何一個socket中的資料準備好了，select就會返回。這個時候使用者程式再呼叫read操作，將資料從kernel拷貝到使用者程式。

　　這個圖和blocking IO的圖其實並沒有太大的不同，事實上，還更差一些。因為這裡需要使用兩個system call (select 和 recvfrom)，而blocking IO只呼叫了一個system call (recvfrom)。但是，用select的優勢在於它可以同時處理多個connection。（多說一句。所以，如果處理的連線數不是很高的話，使用select/epoll的web server不一定比使用multi-threading + blocking IO的web server效能更好，可能延遲還更大。select/epoll的優勢並不是對於單個連線能處理得更快，而是在於能處理更多的連線。）

　　在IO multiplexing Model中，實際中，對於每一個socket，一般都設定成為non-blocking，但是，如上圖所示，整個使用者的process其實是一直被block的。只不過process是被select這個函式block，而不是被socket IO給block。

　　Asynchronous I/O

　　linux下的asynchronous IO其實用得很少。先看一下它的流程：

　　使用者程式發起read操作之後，立刻就可以開始去做其它的事。而另一方面，從kernel的角度，當它受到一個asynchronous read之後，首先它會立刻返回，所以不會對使用者程式產生任何block。然後，kernel會等待資料準備完成，然後將資料拷貝到使用者記憶體，當這一切都完成之後，kernel會給使用者程式傳送一個signal，告訴它read操作完成了。

　　到目前為止，已經將四個IO Model都介紹完了。現在回過頭來回答最初的那幾個問題：blocking和non-blocking的區別在哪，synchronous IO和asynchronous IO的區別在哪。

　　先回答最簡單的這個：blocking vs non-blocking。前面的介紹中其實已經很明確的說明了這兩者的區別。呼叫blocking IO會一直block住對應的程式直到操作完成，而non-blocking IO在kernel還準備資料的情況下會立刻返回。

　　在說明synchronous IO和asynchronous IO的區別之前，需要先給出兩者的定義。Stevens給出的定義（其實是POSIX的定義）是這樣子的：

　　A synchronous I/O operation causes the requesting process to be blocked until that I/O operation completes;

　　An asynchronous I/O operation does not cause the requesting process to be blocked;

　　兩者的區別就在於synchronous IO做”IO operation”的時候會將process阻塞。按照這個定義，之前所述的blocking IO，non-blocking IO，IO multiplexing都屬於synchronous IO。有人可能會說，non-blocking IO並沒有被block啊。這裡有個非常“狡猾”的地方，定義中所指的”IO operation”是指真實的IO操作，就是例子中的recvfrom這個system call。non-blocking IO在執行recvfrom這個system call的時候，如果kernel的資料沒有準備好，這時候不會block程式。但是，當kernel中資料準備好的時候，recvfrom會將資料從kernel拷貝到使用者記憶體中，這個時候程式是被block了，在這段時間內，程式是被block的。而asynchronous IO則不一樣，當程式發起IO 操作之後，就直接返回再也不理睬了，直到kernel傳送一個訊號，告訴程式說IO完成。在這整個過程中，程式完全沒有被block。

　　各個IO Model的比較如圖所示：

　　經過上面的介紹，會發現non-blocking IO和asynchronous IO的區別還是很明顯的。在non-blocking IO中，雖然程式大部分時間都不會被block，但是它仍然要求程式去主動的check，並且當資料準備完成以後，也需要程式主動的再次呼叫recvfrom來將資料拷貝到使用者記憶體。而asynchronous IO則完全不同。它就像是使用者程式將整個IO操作交給了他人（kernel）完成，然後他人做完後發訊號通知。在此期間，使用者程式不需要去檢查IO操作的狀態，也不需要主動的去拷貝資料。

　　最後，再舉幾個不是很恰當的例子來說明這四個IO Model:

　　有 A，B，C，D 四個人在釣魚：

　　A 用的是最老式的魚竿，所以呢，得一直守著，等到魚上鉤了再拉桿；

　　B 的魚竿有個功能，能夠顯示是否有魚上鉤，所以呢，B就和旁邊的MM聊天，隔會再看看有沒有魚上鉤，有的話就迅速拉桿；

　　C 用的魚竿和B差不多，但他想了一個好辦法，就是同時放好幾根魚竿，然後守在旁邊，一旦有顯示說魚上鉤了，它就將對應的魚竿拉起來；

　　D 是個有錢人，乾脆僱了一個人幫他釣魚，一旦那個人把魚釣上來了，就給D發個簡訊。

同步、非同步、阻塞、非阻塞的區別
2018-12-03
非同步
java同步非阻塞IO
2018-07-02
Java
同步非同步，阻塞非阻塞
2020-03-20
非同步
非同步、同步、阻塞、非阻塞
2020-10-28
非同步
怎樣理解阻塞非阻塞與同步非同步的區別？
2019-02-16
非同步
同步、非同步，阻塞、非阻塞理解
2019-01-19
非同步
同步、非同步、阻塞與非阻塞
2018-07-30
非同步
同步非同步與阻塞非阻塞
2019-09-18
非同步
理解阻塞、非阻塞、同步、非同步
2021-08-16
非同步
Java 非阻塞 IO 和非同步 IO
2018-11-14
Java非同步
如何解讀 Java IO、NIO 中的同步阻塞與同步非阻塞？
2020-09-03
Java
IO模式和IO多路複用（阻塞IO、非阻塞IO、同步IO、非同步IO等概念）
2020-11-04
模式非同步
談談對不同I/O模型的理解 (阻塞/非阻塞IO，同步/非同步IO)
2020-11-10
模型非同步
同步阻塞、同步非阻塞、多路複用的介紹
2023-02-01
徹底搞懂同步非同步與阻塞非阻塞
2023-02-15
非同步
【OS】同步非同步/阻塞非阻塞、併發並行序列的區分
2019-03-30
非同步並行
阻塞IO與非阻塞IO
2024-03-25
如何給女朋友解釋什麼是IO中的阻塞、非阻塞、同步、非同步？
2018-12-01
非同步
大白話搞懂什麼是同步/非同步/阻塞/非阻塞
2019-04-17
非同步
socket阻塞與非阻塞，同步與非同步、I/O模型
2023-05-18
非同步模型
python之IO併發-阻塞IO 非阻塞IO IO多路複用非同步IO（協程）
2024-12-09
Python非同步
IO通訊模型（二）同步非阻塞模式NIO（NonBlocking IO）
2019-11-08
模型模式BloC
阻塞非阻塞和同步非同步的區分參考一些書籍
2022-07-03
非同步
對於同步、非同步、阻塞、非阻塞的幾點淺薄理解
2018-08-29
非同步
一篇文章讀懂阻塞，非阻塞，同步，非同步
2018-05-14
非同步
♻️同步和非同步；並行和併發；阻塞和非阻塞
2024-06-09
非同步並行
[譯] 非同步程式設計：阻塞與非阻塞
2019-03-26
非同步程式設計
11、協程和io教程01 -- 併發並行同步非同步阻塞非阻塞以及 IO多路複用
2020-11-13
並行非同步
對執行緒、協程和同步非同步、阻塞非阻塞的理解
2021-03-23
執行緒非同步
併發-0-同步/非同步/阻塞/非阻塞/程式/執行緒
2018-10-17
非同步執行緒
聊聊執行緒與程式 & 阻塞與非阻塞 & 同步與非同步
2019-03-01
執行緒非同步
程式執行緒、同步非同步、阻塞非阻塞、併發並行
2020-03-02
執行緒非同步並行
【死磕NIO】— 阻塞、非阻塞、同步、非同步，傻傻分不清楚
2021-09-21
非同步
[作業系統]阻塞io 非阻塞io Epoll
2024-08-25
作業系統
FastAPI之阻塞式io和非阻塞式io
2024-07-05
ASTAPI
非同步/同步,阻塞/非阻塞,單執行緒/多執行緒概念梳理
2019-02-25
非同步執行緒
【死磕NIO】— 阻塞IO，非阻塞IO，IO複用，訊號驅動IO，非同步IO，這你真的分的清楚嗎？
2021-10-08
非同步
python中非同步非阻塞如何實現
2021-09-11
Python非同步

IO - 同步 非同步 阻塞 非阻塞的區別

相關文章

IO - 同步非同步阻塞非阻塞的區別