十九、Go語言基礎之併發

baidu_39332177發表於2020-11-11

併發是程式設計裡面一個非常重要的概念,Go語言在語言層面天生支援併發,這也是Go語言流行的一個很重要的原因。

Go語言中的併發程式設計

併發與並行

併發:同一時間段內執行多個任務(你在用微信和兩個女朋友聊天)。

並行:同一時刻執行多個任務(你和你朋友都在用微信和女朋友聊天)。

Go語言的併發通過goroutine實現。goroutine類似於執行緒,屬於使用者態的執行緒,我們可以根據需要建立成千上萬個goroutine併發工作。

goroutine是由Go語言的執行時(runtime)排程完成,而執行緒是由作業系統排程完成。

Go語言還提供channel在多個goroutine間進行通訊。

goroutinechannel是 Go 語言秉承的 CSP(Communicating Sequential Process)併發模式的重要實現基礎

goroutine

在java/c++中我們要實現併發程式設計的時候,我們通常需要自己維護一個執行緒池,並且需要自己去包裝一個又一個的任務,同時需要自己去排程執行緒執行任務並維護上下文切換,這一切通常會耗費程式設計師大量的心智。那麼能不能有一種機制,程式設計師只需要定義很多個任務,讓系統去幫助我們把這些任務分配到CPU上實現併發執行呢?

Go語言中的goroutine就是這樣一種機制,goroutine的概念類似於執行緒,但 goroutine是由Go的執行時(runtime)排程和管理的。Go程式會智慧地將 goroutine 中的任務合理地分配給每個CPU。Go語言之所以被稱為現代化的程式語言,就是因為它在語言層面已經內建了排程和上下文切換的機制。

在Go語言程式設計中你不需要去自己寫程式、執行緒、協程,你的技能包裡只有一個技能–goroutine,當你需要讓某個任務併發執行的時候,你只需要把這個任務包裝成一個函式,開啟一個goroutine去執行這個函式就可以了,就是這麼簡單粗暴。

使用goroutine

Go語言中使用goroutine非常簡單,只需要在呼叫函式的時候在前面加上go關鍵字,就可以為一個函式建立一個goroutine

一個goroutine必定對應一個函式,可以建立多個goroutine去執行相同的函式。

啟動單個goroutine

啟動goroutine的方式非常簡單,只需要在呼叫的函式(普通函式和匿名函式)前面加上一個go關鍵字。

舉個例子如下:

func hello() {
	fmt.Println("Hello Goroutine!")
}
func main() {
	hello()
	fmt.Println("main goroutine done!")
}

這個示例中hello函式和下面的語句是序列的,執行的結果是列印完Hello Goroutine!後列印main goroutine done!

接下來我們在呼叫hello函式前面加上關鍵字go,也就是啟動一個goroutine去執行hello這個函式。

func main() {
	go hello() // 啟動另外一個goroutine去執行hello函式
	fmt.Println("main goroutine done!")
}

這一次的執行結果只列印了main goroutine done!,並沒有列印Hello Goroutine!。為什麼呢?

在程式啟動時,Go程式就會為main()函式建立一個預設的goroutine

當main()函式返回的時候該goroutine就結束了,所有在main()函式中啟動的goroutine會一同結束,main函式所在的goroutine就像是權利的遊戲中的夜王,其他的goroutine都是異鬼,夜王一死它轉化的那些異鬼也就全部GG了。

所以我們要想辦法讓main函式等一等hello函式,最簡單粗暴的方式就是time.Sleep了。

func main() {
	go hello() // 啟動另外一個goroutine去執行hello函式
	fmt.Println("main goroutine done!")
	time.Sleep(time.Second)
}

執行上面的程式碼你會發現,這一次先列印main goroutine done!,然後緊接著列印Hello Goroutine!

首先為什麼會先列印main goroutine done!是因為我們在建立新的goroutine的時候需要花費一些時間,而此時main函式所在的goroutine是繼續執行的。

啟動多個goroutine

在Go語言中實現併發就是這樣簡單,我們還可以啟動多個goroutine。讓我們再來一個例子: (這裡使用了sync.WaitGroup來實現goroutine的同步)

var wg sync.WaitGroup

func hello(i int) {
	defer wg.Done() // goroutine結束就登記-1
	fmt.Println("Hello Goroutine!", i)
}
func main() {

	for i := 0; i < 10; i++ {
		wg.Add(1) // 啟動一個goroutine就登記+1
		go hello(i)
	}
	wg.Wait() // 等待所有登記的goroutine都結束
}

多次執行上面的程式碼,會發現每次列印的數字的順序都不一致。這是因為10個goroutine是併發執行的,而goroutine的排程是隨機的。

goroutine與執行緒

可增長的棧

OS執行緒(作業系統執行緒)一般都有固定的棧記憶體(通常為2MB),一個goroutine的棧在其生命週期開始時只有很小的棧(典型情況下2KB),goroutine的棧不是固定的,他可以按需增大和縮小,goroutine的棧大小限制可以達到1GB,雖然極少會用到這麼大。所以在Go語言中一次建立十萬左右的goroutine也是可以的。

goroutine排程

GPM是Go語言執行時(runtime)層面的實現,是go語言自己實現的一套排程系統。區別於作業系統排程OS執行緒。

  • G很好理解,就是個goroutine的,裡面除了存放本goroutine資訊外 還有與所在P的繫結等資訊。
  • P管理著一組goroutine佇列,P裡面會儲存當前goroutine執行的上下文環境(函式指標,堆疊地址及地址邊界),P會對自己管理的goroutine佇列做一些排程(比如把佔用CPU時間較長的goroutine暫停、執行後續的goroutine等等)當自己的佇列消費完了就去全域性佇列裡取,如果全域性佇列裡也消費完了會去其他P的佇列裡搶任務。
  • M(machine)是Go執行時(runtime)對作業系統核心執行緒的虛擬, M與核心執行緒一般是一一對映的關係, 一個groutine最終是要放到M上執行的;

P與M一般也是一一對應的。他們關係是: P管理著一組G掛載在M上執行。當一個G長久阻塞在一個M上時,runtime會新建一個M,阻塞G所在的P會把其他的G 掛載在新建的M上。當舊的G阻塞完成或者認為其已經死掉時 回收舊的M。

P的個數是通過runtime.GOMAXPROCS設定(最大256),Go1.5版本之後預設為物理執行緒數。 在併發量大的時候會增加一些P和M,但不會太多,切換太頻繁的話得不償失。

單從執行緒排程講,Go語言相比起其他語言的優勢在於OS執行緒是由OS核心來排程的,goroutine則是由Go執行時(runtime)自己的排程器排程的,這個排程器使用一個稱為m:n排程的技術(複用/排程m個goroutine到n個OS執行緒)。 其一大特點是goroutine的排程是在使用者態下完成的, 不涉及核心態與使用者態之間的頻繁切換,包括記憶體的分配與釋放,都是在使用者態維護著一塊大的記憶體池, 不直接呼叫系統的malloc函式(除非記憶體池需要改變),成本比排程OS執行緒低很多。 另一方面充分利用了多核的硬體資源,近似的把若干goroutine均分在物理執行緒上, 再加上本身goroutine的超輕量,以上種種保證了go排程方面的效能。

點我瞭解更多

GOMAXPROCS

Go執行時的排程器使用GOMAXPROCS引數來確定需要使用多少個OS執行緒來同時執行Go程式碼。預設值是機器上的CPU核心數。例如在一個8核心的機器上,排程器會把Go程式碼同時排程到8個OS執行緒上(GOMAXPROCS是m:n排程中的n)。

Go語言中可以通過runtime.GOMAXPROCS()函式設定當前程式併發時佔用的CPU邏輯核心數。

Go1.5版本之前,預設使用的是單核心執行。Go1.5版本之後,預設使用全部的CPU邏輯核心數。

我們可以通過將任務分配到不同的CPU邏輯核心上實現並行的效果,這裡舉個例子:

func a() {
	for i := 1; i < 10; i++ {
		fmt.Println("A:", i)
	}
}

func b() {
	for i := 1; i < 10; i++ {
		fmt.Println("B:", i)
	}
}

func main() {
	runtime.GOMAXPROCS(1)
	go a()
	go b()
	time.Sleep(time.Second)
}

兩個任務只有一個邏輯核心,此時是做完一個任務再做另一個任務。 將邏輯核心數設為2,此時兩個任務並行執行,程式碼如下。

func a() {
	for i := 1; i < 10; i++ {
		fmt.Println("A:", i)
	}
}

func b() {
	for i := 1; i < 10; i++ {
		fmt.Println("B:", i)
	}
}

func main() {
	runtime.GOMAXPROCS(2)
	go a()
	go b()
	time.Sleep(time.Second)
}

Go語言中的作業系統執行緒和goroutine的關係:

  1. 一個作業系統執行緒對應使用者態多個goroutine。
  2. go程式可以同時使用多個作業系統執行緒。
  3. goroutine和OS執行緒是多對多的關係,即m:n。

channel

單純地將函式併發執行是沒有意義的。函式與函式間需要交換資料才能體現併發執行函式的意義。

雖然可以使用共享記憶體進行資料交換,但是共享記憶體在不同的goroutine中容易發生競態問題。為了保證資料交換的正確性,必須使用互斥量對記憶體進行加鎖,這種做法勢必造成效能問題。

Go語言的併發模型是CSP(Communicating Sequential Processes),提倡通過通訊共享記憶體而不是通過共享記憶體而實現通訊

如果說goroutine是Go程式併發的執行體,channel就是它們之間的連線。channel是可以讓一個goroutine傳送特定值到另一個goroutine的通訊機制。

Go 語言中的通道(channel)是一種特殊的型別。通道像一個傳送帶或者佇列,總是遵循先入先出(First In First Out)的規則,保證收發資料的順序。每一個通道都是一個具體型別的導管,也就是宣告channel的時候需要為其指定元素型別。

channel型別

channel是一種型別,一種引用型別。宣告通道型別的格式如下:

var 變數 chan 元素型別

舉幾個例子:

var ch1 chan int   // 宣告一個傳遞整型的通道
var ch2 chan bool  // 宣告一個傳遞布林型的通道
var ch3 chan []int // 宣告一個傳遞int切片的通道

建立channel

通道是引用型別,通道型別的空值是nil

var ch chan int
fmt.Println(ch) // <nil>

宣告的通道後需要使用make函式初始化之後才能使用。

建立channel的格式如下:

make(chan 元素型別, [緩衝大小])

channel的緩衝大小是可選的。

舉幾個例子:

ch4 := make(chan int)
ch5 := make(chan bool)
ch6 := make(chan []int)

channel操作

通道有傳送(send)、接收(receive)和關閉(close)三種操作。

傳送和接收都使用<-符號。

現在我們先使用以下語句定義一個通道:

ch := make(chan int)

傳送

將一個值傳送到通道中。

ch <- 10 // 把10傳送到ch中

接收

從一個通道中接收值。

x := <- ch // 從ch中接收值並賦值給變數x
<-ch       // 從ch中接收值,忽略結果

關閉

我們通過呼叫內建的close函式來關閉通道。

close(ch)

關於關閉通道需要注意的事情是,只有在通知接收方goroutine所有的資料都傳送完畢的時候才需要關閉通道。通道是可以被垃圾回收機制回收的,它和關閉檔案是不一樣的,在結束操作之後關閉檔案是必須要做的,但關閉通道不是必須的。

關閉後的通道有以下特點:

  1. 對一個關閉的通道再傳送值就會導致panic。
  2. 對一個關閉的通道進行接收會一直獲取值直到通道為空。
  3. 對一個關閉的並且沒有值的通道執行接收操作會得到對應型別的零值。
  4. 關閉一個已經關閉的通道會導致panic。

無緩衝的通道

無緩衝的通道又稱為阻塞的通道。我們來看一下下面的程式碼:

func main() {
	ch := make(chan int)
	ch <- 10
	fmt.Println("傳送成功")
}

上面這段程式碼能夠通過編譯,但是執行的時候會出現以下錯誤:

fatal error: all goroutines are asleep - deadlock!

goroutine 1 [chan send]:
main.main()
        .../src/github.com/Q1mi/studygo/day06/channel02/main.go:8 +0x54

為什麼會出現deadlock錯誤呢?

因為我們使用ch := make(chan int)建立的是無緩衝的通道,無緩衝的通道只有在有人接收值的時候才能傳送值。就像你住的小區沒有快遞櫃和代收點,快遞員給你打電話必須要把這個物品送到你的手中,簡單來說就是無緩衝的通道必須有接收才能傳送。

上面的程式碼會阻塞在ch <- 10這一行程式碼形成死鎖,那如何解決這個問題呢?

一種方法是啟用一個goroutine去接收值,例如:

func recv(c chan int) {
	ret := <-c
	fmt.Println("接收成功", ret)
}
func main() {
	ch := make(chan int)
	go recv(ch) // 啟用goroutine從通道接收值
	ch <- 10
	fmt.Println("傳送成功")
}

無緩衝通道上的傳送操作會阻塞,直到另一個goroutine在該通道上執行接收操作,這時值才能傳送成功,兩個goroutine將繼續執行。相反,如果接收操作先執行,接收方的goroutine將阻塞,直到另一個goroutine在該通道上傳送一個值。

使用無緩衝通道進行通訊將導致傳送和接收的goroutine同步化。因此,無緩衝通道也被稱為同步通道

有緩衝的通道

解決上面問題的方法還有一種就是使用有緩衝區的通道。我們可以在使用make函式初始化通道的時候為其指定通道的容量,例如:

func main() {
	ch := make(chan int, 1) // 建立一個容量為1的有緩衝區通道
	ch <- 10
	fmt.Println("傳送成功")
}

只要通道的容量大於零,那麼該通道就是有緩衝的通道,通道的容量表示通道中能存放元素的數量。就像你小區的快遞櫃只有那麼個多格子,格子滿了就裝不下了,就阻塞了,等到別人取走一個快遞員就能往裡面放一個。

我們可以使用內建的len函式獲取通道內元素的數量,使用cap函式獲取通道的容量,雖然我們很少會這麼做。

for range從通道迴圈取值

當向通道中傳送完資料時,我們可以通過close函式來關閉通道。

當通道被關閉時,再往該通道傳送值會引發panic,從該通道取值的操作會先取完通道中的值,再然後取到的值一直都是對應型別的零值。那如何判斷一個通道是否被關閉了呢?

我們來看下面這個例子:

// channel 練習
func main() {
	ch1 := make(chan int)
	ch2 := make(chan int)
	// 開啟goroutine將0~100的數傳送到ch1中
	go func() {
		for i := 0; i < 100; i++ {
			ch1 <- i
		}
		close(ch1)
	}()
	// 開啟goroutine從ch1中接收值,並將該值的平方傳送到ch2中
	go func() {
		for {
			i, ok := <-ch1 // 通道關閉後再取值ok=false
			if !ok {
				break
			}
			ch2 <- i * i
		}
		close(ch2)
	}()
	// 在主goroutine中從ch2中接收值列印
	for i := range ch2 { // 通道關閉後會退出for range迴圈
		fmt.Println(i)
	}
}

從上面的例子中我們看到有兩種方式在接收值的時候判斷該通道是否被關閉,不過我們通常使用的是for range的方式。使用for range遍歷通道,當通道被關閉的時候就會退出for range

單向通道

有的時候我們會將通道作為引數在多個任務函式間傳遞,很多時候我們在不同的任務函式中使用通道都會對其進行限制,比如限制通道在函式中只能傳送或只能接收。

Go語言中提供了單向通道來處理這種情況。例如,我們把上面的例子改造如下:

func counter(out chan<- int) {
	for i := 0; i < 100; i++ {
		out <- i
	}
	close(out)
}

func squarer(out chan<- int, in <-chan int) {
	for i := range in {
		out <- i * i
	}
	close(out)
}
func printer(in <-chan int) {
	for i := range in {
		fmt.Println(i)
	}
}

func main() {
	ch1 := make(chan int)
	ch2 := make(chan int)
	go counter(ch1)
	go squarer(ch2, ch1)
	printer(ch2)
}

其中,

  • chan<- int是一個只寫單向通道(只能對其寫入int型別值),可以對其執行傳送操作但是不能執行接收操作;
  • <-chan int是一個只讀單向通道(只能從其讀取int型別值),可以對其執行接收操作但是不能執行傳送操作。

在函式傳參及任何賦值操作中可以將雙向通道轉換為單向通道,但反過來是不可以的。

通道總結

channel常見的異常總結,如下圖:channel異常總結

關閉已經關閉的channel也會引發panic

worker pool(goroutine池)

在工作中我們通常會使用可以指定啟動的goroutine數量–worker pool模式,控制goroutine的數量,防止goroutine洩漏和暴漲。

一個簡易的work pool示例程式碼如下:

func worker(id int, jobs <-chan int, results chan<- int) {
	for j := range jobs {
		fmt.Printf("worker:%d start job:%d\n", id, j)
		time.Sleep(time.Second)
		fmt.Printf("worker:%d end job:%d\n", id, j)
		results <- j * 2
	}
}


func main() {
	jobs := make(chan int, 100)
	results := make(chan int, 100)
	// 開啟3個goroutine
	for w := 1; w <= 3; w++ {
		go worker(w, jobs, results)
	}
	// 5個任務
	for j := 1; j <= 5; j++ {
		jobs <- j
	}
	close(jobs)
	// 輸出結果
	for a := 1; a <= 5; a++ {
		<-results
	}
}

select多路複用

在某些場景下我們需要同時從多個通道接收資料。通道在接收資料時,如果沒有資料可以接收將會發生阻塞。你也許會寫出如下程式碼使用遍歷的方式來實現:

for{
    // 嘗試從ch1接收值
    data, ok := <-ch1
    // 嘗試從ch2接收值
    data, ok := <-ch2
    …
}

這種方式雖然可以實現從多個通道接收值的需求,但是執行效能會差很多。為了應對這種場景,Go內建了select關鍵字,可以同時響應多個通道的操作。

select的使用類似於switch語句,它有一系列case分支和一個預設的分支。每個case會對應一個通道的通訊(接收或傳送)過程。select會一直等待,直到某個case的通訊操作完成時,就會執行case分支對應的語句。具體格式如下:

select{
    case <-ch1:
        ...
    case data := <-ch2:
        ...
    case ch3<-data:
        ...
    default:
        預設操作
}

舉個小例子來演示下select的使用:

func main() {
	ch := make(chan int, 1)
	for i := 0; i < 10; i++ {
		select {
		case x := <-ch:
			fmt.Println(x)
		case ch <- i:
		}
	}
}

使用select語句能提高程式碼的可讀性。

  • 可處理一個或多個channel的傳送/接收操作。
  • 如果多個case同時滿足,select會隨機選擇一個。
  • 對於沒有caseselect{}會一直等待,可用於阻塞main函式。

併發安全和鎖

有時候在Go程式碼中可能會存在多個goroutine同時操作一個資源(臨界區),這種情況會發生競態問題(資料競態)。類比現實生活中的例子有十字路口被各個方向的的汽車競爭;還有火車上的衛生間被車廂裡的人競爭。

舉個例子:

var x int64
var wg sync.WaitGroup

func add() {
	for i := 0; i < 5000; i++ {
		x = x + 1
	}
	wg.Done()
}
func main() {
	wg.Add(2)
	go add()
	go add()
	wg.Wait()
	fmt.Println(x)
}

上面的程式碼中我們開啟了兩個goroutine去累加變數x的值,這兩個goroutine在訪問和修改x變數的時候就會存在資料競爭,導致最後的結果與期待的不符。

互斥鎖

互斥鎖是一種常用的控制共享資源訪問的方法,它能夠保證同時只有一個goroutine可以訪問共享資源。Go語言中使用sync包的Mutex型別來實現互斥鎖。 使用互斥鎖來修復上面程式碼的問題:

var x int64
var wg sync.WaitGroup
var lock sync.Mutex

func add() {
	for i := 0; i < 5000; i++ {
		lock.Lock() // 加鎖
		x = x + 1
		lock.Unlock() // 解鎖
	}
	wg.Done()
}
func main() {
	wg.Add(2)
	go add()
	go add()
	wg.Wait()
	fmt.Println(x)
}

使用互斥鎖能夠保證同一時間有且只有一個goroutine進入臨界區,其他的goroutine則在等待鎖;當互斥鎖釋放後,等待的goroutine才可以獲取鎖進入臨界區,多個goroutine同時等待一個鎖時,喚醒的策略是隨機的。

讀寫互斥鎖

互斥鎖是完全互斥的,但是有很多實際的場景下是讀多寫少的,當我們併發的去讀取一個資源不涉及資源修改的時候是沒有必要加鎖的,這種場景下使用讀寫鎖是更好的一種選擇。讀寫鎖在Go語言中使用sync包中的RWMutex型別。

讀寫鎖分為兩種:讀鎖和寫鎖。當一個goroutine獲取讀鎖之後,其他的goroutine如果是獲取讀鎖會繼續獲得鎖,如果是獲取寫鎖就會等待;當一個goroutine獲取寫鎖之後,其他的goroutine無論是獲取讀鎖還是寫鎖都會等待。

讀寫鎖示例:

var (
	x      int64
	wg     sync.WaitGroup
	lock   sync.Mutex
	rwlock sync.RWMutex
)

func write() {
	// lock.Lock()   // 加互斥鎖
	rwlock.Lock() // 加寫鎖
	x = x + 1
	time.Sleep(10 * time.Millisecond) // 假設讀操作耗時10毫秒
	rwlock.Unlock()                   // 解寫鎖
	// lock.Unlock()                     // 解互斥鎖
	wg.Done()
}

func read() {
	// lock.Lock()                  // 加互斥鎖
	rwlock.RLock()               // 加讀鎖
	time.Sleep(time.Millisecond) // 假設讀操作耗時1毫秒
	rwlock.RUnlock()             // 解讀鎖
	// lock.Unlock()                // 解互斥鎖
	wg.Done()
}

func main() {
	start := time.Now()
	for i := 0; i < 10; i++ {
		wg.Add(1)
		go write()
	}

	for i := 0; i < 1000; i++ {
		wg.Add(1)
		go read()
	}

	wg.Wait()
	end := time.Now()
	fmt.Println(end.Sub(start))
}

需要注意的是讀寫鎖非常適合讀多寫少的場景,如果讀和寫的操作差別不大,讀寫鎖的優勢就發揮不出來。

sync.WaitGroup

在程式碼中生硬的使用time.Sleep肯定是不合適的,Go語言中可以使用sync.WaitGroup來實現併發任務的同步。sync.WaitGroup有以下幾個方法:

方法名功能
(wg * WaitGroup) Add(delta int)計數器+delta
(wg *WaitGroup) Done()計數器-1
(wg *WaitGroup) Wait()阻塞直到計數器變為0

sync.WaitGroup內部維護著一個計數器,計數器的值可以增加和減少。例如當我們啟動了N 個併發任務時,就將計數器值增加N。每個任務完成時通過呼叫Done()方法將計數器減1。通過呼叫Wait()來等待併發任務執行完,當計數器值為0時,表示所有併發任務已經完成。

我們利用sync.WaitGroup將上面的程式碼優化一下:

var wg sync.WaitGroup

func hello() {
	defer wg.Done()
	fmt.Println("Hello Goroutine!")
}
func main() {
	wg.Add(1)
	go hello() // 啟動另外一個goroutine去執行hello函式
	fmt.Println("main goroutine done!")
	wg.Wait()
}

需要注意sync.WaitGroup是一個結構體,傳遞的時候要傳遞指標。

sync.Once

說在前面的話:這是一個進階知識點。

在程式設計的很多場景下我們需要確保某些操作在高併發的場景下只執行一次,例如只載入一次配置檔案、只關閉一次通道等。

Go語言中的sync包中提供了一個針對只執行一次場景的解決方案–sync.Once

sync.Once只有一個Do方法,其簽名如下:

func (o *Once) Do(f func()) {}

備註:如果要執行的函式f需要傳遞引數就需要搭配閉包來使用。

載入配置檔案示例

延遲一個開銷很大的初始化操作到真正用到它的時候再執行是一個很好的實踐。因為預先初始化一個變數(比如在init函式中完成初始化)會增加程式的啟動耗時,而且有可能實際執行過程中這個變數沒有用上,那麼這個初始化操作就不是必須要做的。我們來看一個例子:

var icons map[string]image.Image

func loadIcons() {
	icons = map[string]image.Image{
		"left":  loadIcon("left.png"),
		"up":    loadIcon("up.png"),
		"right": loadIcon("right.png"),
		"down":  loadIcon("down.png"),
	}
}

// Icon 被多個goroutine呼叫時不是併發安全的
func Icon(name string) image.Image {
	if icons == nil {
		loadIcons()
	}
	return icons[name]
}

多個goroutine併發呼叫Icon函式時不是併發安全的,現代的編譯器和CPU可能會在保證每個goroutine都滿足序列一致的基礎上自由地重排訪問記憶體的順序。loadIcons函式可能會被重排為以下結果:

func loadIcons() {
	icons = make(map[string]image.Image)
	icons["left"] = loadIcon("left.png")
	icons["up"] = loadIcon("up.png")
	icons["right"] = loadIcon("right.png")
	icons["down"] = loadIcon("down.png")
}

在這種情況下就會出現即使判斷了icons不是nil也不意味著變數初始化完成了。考慮到這種情況,我們能想到的辦法就是新增互斥鎖,保證初始化icons的時候不會被其他的goroutine操作,但是這樣做又會引發效能問題。

使用sync.Once改造的示例程式碼如下:

var icons map[string]image.Image

var loadIconsOnce sync.Once

func loadIcons() {
	icons = map[string]image.Image{
		"left":  loadIcon("left.png"),
		"up":    loadIcon("up.png"),
		"right": loadIcon("right.png"),
		"down":  loadIcon("down.png"),
	}
}

// Icon 是併發安全的
func Icon(name string) image.Image {
	loadIconsOnce.Do(loadIcons)
	return icons[name]
}

併發安全的單例模式

下面是藉助sync.Once實現的併發安全的單例模式:

package singleton

import (
    "sync"
)

type singleton struct {}

var instance *singleton
var once sync.Once

func GetInstance() *singleton {
    once.Do(func() {
        instance = &singleton{}
    })
    return instance
}

sync.Once其實內部包含一個互斥鎖和一個布林值,互斥鎖保證布林值和資料的安全,而布林值用來記錄初始化是否完成。這樣設計就能保證初始化操作的時候是併發安全的並且初始化操作也不會被執行多次。

sync.Map

Go語言中內建的map不是併發安全的。請看下面的示例:

var m = make(map[string]int)

func get(key string) int {
	return m[key]
}

func set(key string, value int) {
	m[key] = value
}

func main() {
	wg := sync.WaitGroup{}
	for i := 0; i < 20; i++ {
		wg.Add(1)
		go func(n int) {
			key := strconv.Itoa(n)
			set(key, n)
			fmt.Printf("k=:%v,v:=%v\n", key, get(key))
			wg.Done()
		}(i)
	}
	wg.Wait()
}

上面的程式碼開啟少量幾個goroutine的時候可能沒什麼問題,當併發多了之後執行上面的程式碼就會報fatal error: concurrent map writes錯誤。

像這種場景下就需要為map加鎖來保證併發的安全性了,Go語言的sync包中提供了一個開箱即用的併發安全版map–sync.Map。開箱即用表示不用像內建的map一樣使用make函式初始化就能直接使用。同時sync.Map內建了諸如StoreLoadLoadOrStoreDeleteRange等操作方法。

var m = sync.Map{}

func main() {
	wg := sync.WaitGroup{}
	for i := 0; i < 20; i++ {
		wg.Add(1)
		go func(n int) {
			key := strconv.Itoa(n)
			m.Store(key, n)
			value, _ := m.Load(key)
			fmt.Printf("k=:%v,v:=%v\n", key, value)
			wg.Done()
		}(i)
	}
	wg.Wait()
}

原子操作

程式碼中的加鎖操作因為涉及核心態的上下文切換會比較耗時、代價比較高。針對基本資料型別我們還可以使用原子操作來保證併發安全,因為原子操作是Go語言提供的方法它在使用者態就可以完成,因此效能比加鎖操作更好。Go語言中原子操作由內建的標準庫sync/atomic提供。

atomic包

方法解釋
func LoadInt32(addr *int32) (val int32)
func LoadInt64(addr *int64) (val int64)
func LoadUint32(addr *uint32) (val uint32)
func LoadUint64(addr *uint64) (val uint64)
func LoadUintptr(addr *uintptr) (val uintptr)
func LoadPointer(addr *unsafe.Pointer) (val unsafe.Pointer)
讀取操作
func StoreInt32(addr *int32, val int32)
func StoreInt64(addr *int64, val int64)
func StoreUint32(addr *uint32, val uint32)
func StoreUint64(addr *uint64, val uint64)
func StoreUintptr(addr *uintptr, val uintptr)
func StorePointer(addr *unsafe.Pointer, val unsafe.Pointer)
寫入操作
func AddInt32(addr *int32, delta int32) (new int32)
func AddInt64(addr *int64, delta int64) (new int64)
func AddUint32(addr *uint32, delta uint32) (new uint32)
func AddUint64(addr *uint64, delta uint64) (new uint64)
func AddUintptr(addr *uintptr, delta uintptr) (new uintptr)
修改操作
func SwapInt32(addr *int32, new int32) (old int32)
func SwapInt64(addr *int64, new int64) (old int64)
func SwapUint32(addr *uint32, new uint32) (old uint32)
func SwapUint64(addr *uint64, new uint64) (old uint64)
func SwapUintptr(addr *uintptr, new uintptr) (old uintptr)
func SwapPointer(addr *unsafe.Pointer, new unsafe.Pointer) (old unsafe.Pointer)
交換操作
func CompareAndSwapInt32(addr *int32, old, new int32) (swapped bool)
func CompareAndSwapInt64(addr *int64, old, new int64) (swapped bool)
func CompareAndSwapUint32(addr *uint32, old, new uint32) (swapped bool)
func CompareAndSwapUint64(addr *uint64, old, new uint64) (swapped bool)
func CompareAndSwapUintptr(addr *uintptr, old, new uintptr) (swapped bool)
func CompareAndSwapPointer(addr *unsafe.Pointer, old, new unsafe.Pointer) (swapped bool)
比較並交換操作

示例

我們填寫一個示例來比較下互斥鎖和原子操作的效能。

package main

import (
	"fmt"
	"sync"
	"sync/atomic"
	"time"
)

type Counter interface {
	Inc()
	Load() int64
}

// 普通版
type CommonCounter struct {
	counter int64
}

func (c CommonCounter) Inc() {
	c.counter++
}

func (c CommonCounter) Load() int64 {
	return c.counter
}

// 互斥鎖版
type MutexCounter struct {
	counter int64
	lock    sync.Mutex
}

func (m *MutexCounter) Inc() {
	m.lock.Lock()
	defer m.lock.Unlock()
	m.counter++
}

func (m *MutexCounter) Load() int64 {
	m.lock.Lock()
	defer m.lock.Unlock()
	return m.counter
}

// 原子操作版
type AtomicCounter struct {
	counter int64
}

func (a *AtomicCounter) Inc() {
	atomic.AddInt64(&a.counter, 1)
}

func (a *AtomicCounter) Load() int64 {
	return atomic.LoadInt64(&a.counter)
}

func test(c Counter) {
	var wg sync.WaitGroup
	start := time.Now()
	for i := 0; i < 1000; i++ {
		wg.Add(1)
		go func() {
			c.Inc()
			wg.Done()
		}()
	}
	wg.Wait()
	end := time.Now()
	fmt.Println(c.Load(), end.Sub(start))
}

func main() {
	c1 := CommonCounter{} // 非併發安全
	test(c1)
	c2 := MutexCounter{} // 使用互斥鎖實現併發安全
	test(&c2)
	c3 := AtomicCounter{} // 併發安全且比互斥鎖效率更高
	test(&c3)
}

atomic包提供了底層的原子級記憶體操作,對於同步演算法的實現很有用。這些函式必須謹慎地保證正確使用。除了某些特殊的底層應用,使用通道或者sync包的函式/型別實現同步更好。

練習題

  1. 使用goroutinechannel實現一個計算int64隨機數各位數和的程式。
    1. 開啟一個goroutine迴圈生成int64型別的隨機數,傳送到jobChan
    2. 開啟24個goroutinejobChan中取出隨機數計算各位數的和,將結果傳送到resultChan
    3. goroutineresultChan取出結果並列印到終端輸出
  2. 為了保證業務程式碼的執行效能將之前寫的日誌庫改寫為非同步記錄日誌方式。

相關文章