《快學 Go 語言》第 12 課 —— 通道

老錢發表於2018-12-06

不同的並行協程之間交流的方式有兩種,一種是通過共享變數,另一種是通過佇列。Go 語言鼓勵使用佇列的形式來交流,它單獨為協程之間的佇列資料交流定製了特殊的語法 —— 通道。

通道是協程的輸入和輸出。作為協程的輸出,通道是一個容器,它可以容納資料。作為協程的輸入,通道是一個生產者,它可以向協程提供資料。通道作為容器是有限定大小的,滿了就寫不進去,空了就讀不出來。通道還有它自己的型別,它可以限定進入通道的資料的型別。

圖片

建立通道

建立通道只有一種語法,那就是 make 全域性函式,提供第一個型別引數限定通道可以容納的資料型別,再提供第二個整數引數作為通道的容器大小。大小引數是可選的,如果不填,那這個通道的容量為零,叫著「非緩衝型通道」,非緩衝型通道必須確保有協程正在嘗試讀取當前通道,否則寫操作就會阻塞直到有其它協程來從通道中讀東西。非緩衝型通道總是處於既滿又空的狀態。與之對應的有限定大小的通道就是緩衝型通道。在 Go 語言裡不存在無界通道,每個通道都是有限定最大容量的。

// 緩衝型通道,裡面只能放整數var bufferedChannel = make(chan int, 1024)// 非緩衝型通道var unbufferedChannel = make(chan int)複製程式碼

讀寫通道

Go 語言為通道的讀寫設計了特殊的箭頭語法糖 <
-,讓我們使用通道時非常方便。把箭頭寫在通道變數的右邊就是寫通道,把箭頭寫在通道的左邊就是讀通道。一次只能讀寫一個元素。

package mainimport "fmt"func main() { 
var ch chan int = make(chan int, 4) for i:=0;
i<
cap(ch);
i++ {
ch <
- i // 寫通道
} for len(ch) >
0 {
var value int = <
- ch // 讀通道 fmt.Println(value)
}
}複製程式碼

通道作為容器,它可以像切片一樣,使用 cap() 和 len() 全域性函式獲得通道的容量和當前內部的元素個數。通道一般作為不同的協程交流的媒介,在同一個協程裡它也是可以使用的。

讀寫阻塞

通道滿了,寫操作就會阻塞,協程就會進入休眠,直到有其它協程讀通道挪出了空間,協程才會被喚醒。如果有多個協程的寫操作都阻塞了,一個讀操作只會喚醒一個協程。

通道空了,讀操作就會阻塞,協程也會進入睡眠,直到有其它協程寫通道裝進了資料才會被喚醒。如果有多個協程的讀操作阻塞了,一個寫操作也只會喚醒一個協程。

package mainimport "fmt"import "time"import "math/rand"func send(ch chan int) { 
for {
var value = rand.Intn(100) ch <
- value fmt.Printf("send %d\n", value)
}
}func recv(ch chan int) {
for {
value := <
- ch fmt.Printf("recv %d\n", value) time.Sleep(time.Second)
}
}func main() {
var ch = make(chan int, 1) // 子協程迴圈讀 go recv(ch) // 主協程迴圈寫 send(ch)
}--------send 81send 87recv 81recv 87send 47recv 47send 59複製程式碼

關閉通道

Go 語言的通道有點像檔案,不但支援讀寫操作, 還支援關閉。讀取一個已經關閉的通道會立即返回通道型別的「零值」,而寫一個已經關閉的通道會拋異常。如果通道里的元素是整型的,讀操作是不能通過返回值來確定通道是否關閉的。

package mainimport "fmt"func main() { 
var ch = make(chan int, 4) ch <
- 1 ch <
- 2 close(ch) value := <
- ch fmt.Println(value) value = <
- ch fmt.Println(value) value = <
- ch fmt.Println(value)
}-------120複製程式碼

這時候就需要引入一個新的知識點 —— 使用 for range 語法糖來遍歷通道

for range 語法我們已經見了很多次了,它是多功能的,除了可以遍歷陣列、切片、字典,還可以遍歷通道,取代箭頭操作符。當通道空了,迴圈會暫停阻塞,當通道關閉時,阻塞停止,迴圈也跟著結束了。當迴圈結束時,我們就知道通道已經關閉了。

package mainimport "fmt"func main() { 
var ch = make(chan int, 4) ch <
- 1 ch <
- 2 close(ch) // for range 遍歷通道 for value := range ch {
fmt.Println(value)
}
}------12複製程式碼

通道如果沒有顯式關閉,當它不再被程式使用的時候,會自動關閉被垃圾回收掉。不過優雅的程式應該將通道看成資源,顯式關閉每個不再使用的資源是一種良好的習慣。

通道寫安全

上面提到向一個已經關閉的通道執行寫操作會丟擲異常,這意味著我們在寫通道時一定要確保通道沒有被關閉。

package mainimport "fmt"func send(ch chan int) { 
i := 0 for {
i++ ch <
- i
}
}func recv(ch chan int) {
value := <
- ch fmt.Println(value) value = <
- ch fmt.Println(value) close(ch)
}func main() {
var ch = make(chan int, 4) go recv(ch) send(ch)
}---------12panic: send on closed channelgoroutine 1 [running]:main.send(0xc42008a000) /Users/qianwp/go/src/github.com/pyloque/practice/main.go:9 +0x44main.main() /Users/qianwp/go/src/github.com/pyloque/practice/main.go:24 +0x66exit status 2複製程式碼

那如何確保呢?Go 語言並不存在一個內建函式可以判斷出通道是否已經被關閉。即使存在這樣一個函式,當你判斷時通道沒有關閉,並不意味著當你往通道里寫資料時它就一定沒有被關閉,併發環境下,它是可能被其它協程隨時關閉的。

確保通道寫安全的最好方式是由負責寫通道的協程自己來關閉通道,讀通道的協程不要去關閉通道。

package mainimport "fmt"func send(ch chan int) { 
ch <
- 1 ch <
- 2 ch <
- 3 ch <
- 4 close(ch)
}func recv(ch chan int) {
for v := range ch {
fmt.Println(v)
}
}func main() {
var ch = make(chan int, 1) go send(ch) recv(ch)
}-----------1234複製程式碼

這個方法確實可以解決單寫多讀的場景,可要是遇上了多寫單讀的場合該怎麼辦呢?任意一個讀寫通道的協程都不可以隨意關閉通道,否則會導致其它寫通道協程丟擲異常。這時候就必須讓其它不相干的協程來幹這件事,這個協程需要等待所有的寫通道協程都結束執行後才能關閉通道。那其它協程要如何才能知道所有的寫通道已經結束執行了呢?這個就需要使用到內建 sync 包提供的 WaitGroup 物件,它使用計數來等待指定事件完成。

package mainimport "fmt"import "time"import "sync"func send(ch chan int, wg *sync.WaitGroup) { 
defer wg.Done() // 計數值減一 i := 0 for i <
4 {
i++ ch <
- i
}
}func recv(ch chan int) {
for v := range ch {
fmt.Println(v)
}
}func main() {
var ch = make(chan int, 4) var wg = new(sync.WaitGroup) wg.Add(2) // 增加計數值 go send(ch, wg) // 寫 go send(ch, wg) // 寫 go recv(ch) // Wait() 阻塞等待所有的寫通道協程結束 // 待計數值變成零,Wait() 才會返回 wg.Wait() // 關閉通道 close(ch) time.Sleep(time.Second)
}---------12341234複製程式碼

多路通道

在真實的世界中,還有一種訊息傳遞場景,那就是消費者有多個消費來源,只要有一個來源生產了資料,消費者就可以讀這個資料進行消費。這時候可以將多個來源通道的資料匯聚到目標通道,然後統一在目標通道進行消費。

package mainimport "fmt"import "time"// 每隔一會生產一個數func send(ch chan int, gap time.Duration) { 
i := 0 for {
i++ ch <
- i time.Sleep(gap)
}
}// 將多個原通道內容拷貝到單一的目標通道func collect(source chan int, target chan int) {
for v := range source {
target <
- v
}
}// 從目標通道消費資料func recv(ch chan int) {
for v := range ch {
fmt.Printf("receive %d\n", v)
}
}func main() {
var ch1 = make(chan int) var ch2 = make(chan int) var ch3 = make(chan int) go send(ch1, time.Second) go send(ch2, 2 * time.Second) go collect(ch1, ch3) go collect(ch2, ch3) recv(ch3)
}---------receive 1receive 1receive 2receive 2receive 3receive 4receive 3receive 5receive 6receive 4receive 7receive 8receive 5receive 9....複製程式碼

但是上面這種形式比較繁瑣,需要為每一種消費來源都單獨啟動一個匯聚協程。Go 語言為這種使用場景帶來了「多路複用」語法糖,也就是下面要講的 select 語句,它可以同時管理多個通道讀寫,如果所有通道都不能讀寫,它就整體阻塞,只要有一個通道可以讀寫,它就會繼續。下面我們使用 select 語句來簡化上面的邏輯

package mainimport "fmt"import "time"func send(ch chan int, gap time.Duration) { 
i := 0 for {
i++ ch <
- i time.Sleep(gap)
}
}func recv(ch1 chan int, ch2 chan int) {
for {
select {
case v := <
- ch1: fmt.Printf("recv %d from ch1\n", v) case v := <
- ch2: fmt.Printf("recv %d from ch2\n", v)
}
}
}func main() {
var ch1 = make(chan int) var ch2 = make(chan int) go send(ch1, time.Second) go send(ch2, 2 * time.Second) recv(ch1, ch2)
}------------recv 1 from ch2recv 1 from ch1recv 2 from ch1recv 3 from ch1recv 2 from ch2recv 4 from ch1recv 3 from ch2recv 5 from ch1複製程式碼

上面是多路複用 select 語句的讀通道形式,下面是它的寫通道形式,只要有一個通道能寫進去,它就會打破阻塞。

select { 
case ch1 <
- v: fmt.Println("send to ch1") case ch2 <
- v: fmt.Println("send to ch2")
}複製程式碼

非阻塞讀寫

前面我們講的讀寫都是阻塞讀寫,Go 語言還提供了通道的非阻塞讀寫。當通道空時,讀操作不會阻塞,當通道滿時,寫操作也不會阻塞。非阻塞讀寫需要依靠 select 語句的 default 分支。當 select 語句所有通道都不可讀寫時,如果定義了 default 分支,那就會執行 default 分支邏輯,這樣就起到了不阻塞的效果。下面我們演示一個單生產者多消費者的場景。生產者同時向兩個通道寫資料,寫不進去就丟棄。

package mainimport "fmt"import "time"func send(ch1 chan int, ch2 chan int) { 
i := 0 for {
i++ select {
case ch1 <
- i: fmt.Printf("send ch1 %d\n", i) case ch2 <
- i: fmt.Printf("send ch2 %d\n", i) default:
}
}
}func recv(ch chan int, gap time.Duration, name string) {
for v := range ch {
fmt.Printf("receive %s %d\n", name, v) time.Sleep(gap)
}
}func main() {
// 無緩衝通道 var ch1 = make(chan int) var ch2 = make(chan int) // 兩個消費者的休眠時間不一樣,名稱不一樣 go recv(ch1, time.Second, "ch1") go recv(ch2, 2 * time.Second, "ch2") send(ch1, ch2)
}------------send ch1 27send ch2 28receive ch1 27receive ch2 28send ch1 6708984receive ch1 6708984send ch2 13347544send ch1 13347775receive ch2 13347544receive ch1 13347775send ch1 20101642receive ch1 20101642send ch2 26775795receive ch2 26775795...複製程式碼

從輸出中可以明顯看出有很多的資料都丟棄了,消費者讀到的資料是不連續的。如果將 select 語句裡面的 default 分支幹掉,再執行一次,結果如下

send ch2 1send ch1 2receive ch1 2receive ch2 1receive ch1 3send ch1 3receive ch2 4send ch2 4send ch1 5receive ch1 5receive ch1 6send ch1 6receive ch1 7複製程式碼

可以看到消費者讀到的資料都連續了,但是每個資料只給了一個消費者。select 語句的 default 分支非常關鍵,它是決定通道讀寫操作阻塞與否的關鍵。

Java 也有通道

通道在其它語言裡面的表現形式是佇列,在 Java 語言裡,帶緩衝通道就是併發包內建的 java.util.concurrent.ArrayBlockingQueue,無緩衝通道也是併發包內建的 java.util.concurrent.SynchronousQueue。ArrayBlockingQueue 的內部實現形式是一個陣列,多執行緒讀寫時需要使用鎖來控制併發訪問。不過像 Go 語言提供的多路複用效果,Java 語言就沒有內建的實現了。

通道內部結構

Go 語言的通道內部結構是一個迴圈陣列,通過讀寫偏移量來控制元素髮送和接受。它為了保證執行緒安全,內部會有一個全域性鎖來控制併發。對於傳送和接受操作都會有一個佇列來容納處於阻塞狀態的協程。

圖片
type hchan struct { 
qcount uint // 通道有效元素個數 dataqsize uint // 通道容量,迴圈陣列總長度 buf unsafe.Pointer // 陣列地址 elemsize uint16 // 內部元素的大小 closed uint32 // 是否已關閉 0或者1 elemtype *_type // 內部元素型別資訊 sendx uint // 迴圈陣列的寫偏移量 recvx uint // 迴圈陣列的讀偏移量 recvq waitq // 阻塞在讀操作上的協程佇列 sendq waitq // 阻塞在寫操作上的協程佇列 lock mutex // 全域性鎖
}複製程式碼

這個迴圈佇列和 Java 語言內建的 ArrayBlockingQueue 結構如出一轍。從這個資料結構中我們也可以得出結論:佇列在本質上是使用共享變數加鎖的方式來實現的,共享變數才是並行交流的本質。

class ArrayBlockingQueue extends AbstractQueue { 
Object[] items;
int takeIndex;
int putIndex;
int count;
ReentrantLock lock;
...
}複製程式碼

所以讀者不要認為 Go 語言的通道很神奇,Go 語言只是對通道設計了一套便於使用的語法糖,讓這套資料結構顯的平易近人。它在內部實現上和其它語言的併發佇列大同小異。

《快學 Go 語言》第 12 課 —— 通道

閱讀《快學 Go 語言》更多章節,長按圖片識別二維碼關注公眾號「碼洞」

來源:https://juejin.im/post/5c0888cd6fb9a049c15f0170#comment

相關文章