Go的迴圈遍歷使用小坑

尋尋覓覓的Gopher發表於2021-02-10

在Golang的流程控制中,迴圈語句有for和range兩種。

for語句

  1. for 賦值表示式; 關係表示式或邏輯表示式; 賦值表示式 { }

    for i := 0; i < 10; i++ {
    }
  2. for 關係表示式或邏輯表示式 { }

    n := 10
    for n > 0 {
     n--
    }
  3. for { }

    for {
     fmt.Println("hello world")
    }
    // 等價於
    // for true {
    //     fmt.Println("hello world")
    // }

range語句

Golang range類似迭代器操作,可以對 slice、map、陣列、字串等進行迭代迴圈。在字串、陣列和切片中它返回 (索引, 值) ,在集合中返回 (鍵, 值),但若當只有一個返回值時,第一個引數是索引或鍵。

str := "abc"
for i, char := range str {
    fmt.Printf("%d => %s\n", i, string(char))
}
for i := range str { //只有一個返回值
    fmt.Printf("%d\n", i)
}
nums := []int{1, 2, 3}
for i, num := range nums {
    fmt.Printf("%d => %d\n", i, num)
}
kvs := map[string]string{"a": "apple", "b": "banana"}
for k, v := range kvs {
    fmt.Printf("%s => %s\n", k, v)
}
for k := range kvs { //只有一個返回值
    fmt.Printf("%s\n", k)
}
// 輸出結果
// 0 => a
// 1 => b
// 2 => c
// 0
// 1
// 2
// 0 => 1
// 1 => 2
// 2 => 3
// a => apple
// b => banana
// a
// b

for迴圈尤其是range語句,在平時開發過程中頻繁使用,但很多開發者(本人算一個)經常會在以下場景中踩坑。

場景一,使用迴圈迭代器的變數

先來看一個明顯的錯誤:

func main() {
    var out []*int
    for i := 0; i < 3; i++ {
        // i := i
        out = append(out, &i)
    }
    fmt.Println("值:", *out[0], *out[1], *out[2])
    fmt.Println("地址:", out[0], out[1], out[2])
}
// 輸出結果
// 值: 3 3 3
// 地址: 0xc000012090 0xc000012090 0xc000012090

分析

out是一個整型指標陣列變數,在for迴圈中,宣告瞭一個i變數,每次迴圈將i的地址追加到out切片中,但是每次追加的其實都是i變數,因此我們追加的是一個相同的地址,而該地址最終的值是3。

正確做法

解開程式碼中的註釋// i := i,每次迴圈時都重新建立一個新的i變數。


再看一個比較隱祕的錯誤:

func main() {
    a1 := []int{1, 2, 3}
    a2 := make([]*int, len(a1))

    for i, v := range a1 {
        a2[i] = &v
    }

    fmt.Println("值:", *a2[0], *a2[1], *a2[2])
    fmt.Println("地址:", a2[0], a2[1], a2[2])
}
// 輸出結果
// 值: 3 3 3
// 地址: 0xc000012090 0xc000012090 0xc000012090

分析

大多數人就是在range這裡給變數賦值的時候踩坑,因為比較隱祕,其實情況和上面的一樣,range在遍歷值型別時,其中的v是一個區域性變數,只會宣告初始化一次,之後每次迴圈時重新賦值覆蓋前面的,所以給a2[i]賦值的時候其實都是同一個地址&v,而v最終的值為a1最後一個元素的值,也就是3。

正確做法

a2[i]賦值時傳遞原始指標,即a2[i] = &a1[i]
②建立臨時變數t := va2[i] = &t
③閉包(與②原理一樣),func(v int) { a2[i] = &v }(v)


更為隱祕的還有:

func main() {
    var out [][]int
    for _, i := range [][1]int{{1}, {2}, {3}} {
        out = append(out, i[:])
    }
    fmt.Println("Values:", out)
}
// 輸出結果
// [[3] [3] [3]]

原理也是一樣的,不論遍歷多少次,i[:]總是被本次遍歷的值所覆蓋

場景二,在迴圈體內使用goroutines

func main() {
    values := []int{1, 2, 3}
    wg := sync.WaitGroup{}
    for _, val := range values {
        wg.Add(1)
        go func() {
            fmt.Println(val)
            wg.Done()
        }()
    }
    wg.Wait()
}
// 輸出結果
// 3
// 3
// 3

分析

對於主協程來講,迴圈是很快就跑完的,而這個時候各個協程可能才開始跑,此時val的值已經遍歷到最後一個了,所以各協程都輸出了3。(如果遍歷資料龐大,主協程遍歷耗時較久的話,goroutine的輸出會根據當時候的val的值,所以每次的輸出結果不一定相同的。)

解決辦法

①使用臨時變數

for _, val := range values {
    wg.Add(1)
    val := val
    go func() {
        fmt.Println(val)
        wg.Done()
    }()
}

②使用閉包

for _, val := range values {
    wg.Add(1)
    go func(val int) {
        fmt.Println(val)
        wg.Done()
    }(val)
}

Go

本作品採用《CC 協議》,轉載必須註明作者和本文連結

相關文章