前言
最近實現某個業務時,需要讀取資料然後再非同步處理;在 Go 中實現起來自然就比較簡單,虛擬碼如下:
list := []*Demo{{"a"}, {"b"}}
for _, v := range list {
go func() {
fmt.Println("name="+v.Name)
}()
}
type Demo struct {
Name string
}
看似非常簡單幾行程式碼卻和我們的預期不符,列印之後輸出的是:
name=b
name=b
並不是我們預期的:
name=a
name=b
坑一
由於寫 go 的資歷尚淺、道行更是淺薄,這 bug
我硬是找了個把小時;剛開始還以為是資料來源的問題,經歷了好幾輪自我懷疑。總之過程先不表,先看看如何修復這個問題。
首先第一種辦法是使用臨時變數:
list := []*Demo{{"a"}, {"b"}}
for _, v := range list {
temp:=v
go func() {
fmt.Println("name="+temp.Name)
}()
}
這樣便可正確輸出,其實從這種寫法中也能看出問題的端倪。
在第一種沒有使用臨時變數時,主協程很快就執行完畢,這時候列印的子協程可能還沒執行;當開始執行的時候,這裡的 v 已經被最後一個賦值了。
所以這裡列印的一直都是最後一個變數。
而使用臨時變數會將當前遍歷的值拷貝一份,自然就不會互相影響了。
當然除了臨時變數也可使用閉包解決。
list := []*Demo{{"a"}, {"b"}}
for _, v := range list {
go func(temp *Demo) {
fmt.Println("name="+temp.Name)
}(v)
}
將引數通過閉包傳遞時,每個 goroutine
都會在自己的棧中存放一份引數的拷貝,這樣也能區分了。
坑二
與之類似的還有第二個坑:
list2 := []Demo{{"a"}, {"b"}}
var alist []*Demo
for _, test := range list2 {
alist = append(alist, &test)
}
fmt.Println(alist[0].Name, alist[1].Name)
這段程式碼與我們預期不不符:
b b
但我們稍加修改就可以了:
list2 := []Demo{{"a"}, {"b"}}
var alist []Demo
for _, test := range list2 {
fmt.Printf("addr=%p\n", &test)
alist = append(alist, test)
}
fmt.Println(alist[0].Name, alist[1].Name)
addr=0xc000010240
addr=0xc000010240
a b
順便列印了記憶體地址,其實從結果中大概就能猜到原因;每次遍歷列印的記憶體地址都是相同,所以如果我們存放的是指標,本質上儲存的都是同一塊記憶體地址的內容,所以值相同。
而如果我們只儲存值,不存指標自然也不會有這個問題。
但如果想使用指標如何處理呢?
list2 := []Demo{{"a"}, {"b"}}
var alist []*Demo
for _, test := range list2 {
temp := test
//fmt.Printf("addr=%p\n", &test)
alist = append(alist, &temp)
}
fmt.Println(alist[0].Name, alist[1].Name)
也簡單,同樣的使用臨時變數即可。
通過官方原始碼可以得知,for range
只是語法糖,本質上也是 for 迴圈;因為每次都是對同一個物件遍歷賦值,所以便會出現這樣的“烏龍”。
defer 的坑
for
迴圈 + defer
也是組合坑(雖然不推薦這麼用),還是先來看個例子:
// demo1
func main() {
a := []int{1, 2, 3}
for _, v := range a {
defer fmt.Println(v)
}
}
// demo2
func main() {
a := []int{1, 2, 3}
for _, v := range a {
defer func() {
fmt.Println(v)
}()
}
}
分別輸出:
//demo1
3
2
1
//demo2
3
3
3
demo1
的結果很好理解,defer
可以理解為將執行語句放入到棧中,所以呈現的結果是先進後出。
而demo2
中,由於是閉包,閉包對變數 v 持有的是引用,所以在最終延遲執行時 v 已經被最後一個值賦值,所以列印出來都是相同的。
解決方法與上文類似,傳入引數即可解決:
for _, v := range a {
defer func(v int) {
fmt.Println(v)
}(v)
}
這類細節問題日常開發大概率是碰不上的,最有可能遇到的就是面試了,所以多瞭解瞭解也沒壞處。
總結
類似於第一種情況在 for 迴圈中 goroutine
呼叫,我覺得 IDE
完全是可以做到提醒的;比如 IDEA
中就把大部分認為可能發的錯誤包含進去,期待後續 goland
的更新。
但其實這幾種錯誤官方部落格已經提醒過了。
https://github.com/golang/go/wiki/CommonMistakes#using-reference-to-loop-iterator-variable
只是大部分人估計都沒去看過,這事之後我也得花時間好好閱讀下。