Go 效能提升tips--邊界檢查

failymao發表於2021-12-05

1. 什麼是邊界檢查?

邊界檢查,英文名 Bounds Check Elimination,簡稱為 BCE。它是 Go 語言中防止陣列、切片越界而導致記憶體不安全的檢查手段。如果檢查下標已經越界了,就會產生 Panic。

邊界檢查使得我們的程式碼能夠安全地執行,但是另一方面,也使得我們的程式碼執行效率略微降低。

比如下面這段程式碼,會進行三次的邊界檢查

package main

func f(s []int) {
    _ = s[0]  // 檢查第一次
    _ = s[1]  // 檢查第二次
    _ = s[2]  // 檢查第三次
}

func main() {}

你可能會好奇了,三次?我是怎麼知道它要檢查三次的。

實際上,你只要在編譯的時候,加上引數即可,命令如下

go build -gcflags="-d=ssa/check_bce" demo.go
# command-line-arguments
./demo.go:4:7: Found IsInBounds
./demo.go:5:7: Found IsInBounds
./demo.go:6:7: Found IsInBounds

2. 邊界檢查的條件?

並不是所有的對陣列、切片進行索引操作都需要邊界檢查。

比如下面這個示例,就不需要進行邊界檢查,因為編譯器根據上下文已經得知,s 這個切片的長度是多少,你的終止索引是多少,立馬就能判斷到底有沒有越界,因此是不需要再進行邊界檢查,因為在編譯的時候就已經知道這個地方會不會 panic。

package main

func f1() {
    s := []int{1, 2, 3, 4}
    _ = s[:9] // 不需要邊界檢查

}
func main() {}

因此可以得出結論: 對於在編譯階段無法判斷是否會越界的索引操作才會需要邊界檢查
比如這樣子

package main


func f(s []int) {
    _ = s[:9]  // 需要邊界檢查
}
func main()  {}

3. 邊界檢查的特殊案例

3.1 案例一

在如下示例程式碼中,由於索引 2 在最前面已經檢查過會不會越界,因此聰明的編譯器可以推斷出後面的索引 0 和 1 不用再檢查啦

 package main

func f(s []int) {
    _ = s[2] // 檢查一次
    _ = s[1]  // 不會檢查
    _ = s[0]  // 不會檢查
}

func main() {}

3.2 案例二

在下面這個示例中,可以在邏輯上保證不會越界的程式碼,同樣是不會進行越界檢查的。

package main

func f(s []int) {
    for index, _ := range s {
        _ = s[index]
        _ = s[:index+1]
        _ = s[index:len(s)]
    }
}

func main()  {}

3.3 案例三

在如下示例程式碼中,雖然陣列的長度和容量可以確定,但是索引是通過 rand.Intn() 函式取得的隨機數,在編譯器看來這個索引值是不確定的,它有可能大於陣列的長度,也有可能小於陣列的長度。

因此第一次是需要進行檢查的,有了第一次檢查後,第二次索引從邏輯上就能推斷,所以不會再進行邊界檢查。

package main

import (
    "math/rand"
)

func f()  {
    s := make([]int, 3, 3)
    index := rand.Intn(3)
     _ = s[:index]  // 第一次檢查
    _ = s[index:]  // 不會檢查
}

func main()  {}

但如果把上面的程式碼稍微改一下,讓切片的長度和容量變得不一樣,結果又會變得不一樣了。

package main

import (
    "math/rand"
)

func f()  {
    s := make([]int, 3, 5)
    index := rand.Intn(3)
     _ = s[:index]  // 第一次檢查
    _ = s[index:]  // 第二次檢查
}

func main()  {}

只有當陣列的長度和容量相等時, :index 成立,才能一定能推出 index: 也成立,這樣的話,只要做一次檢查即可

一旦陣列的長度和容量不相等,那麼 index 在編譯器看來是有可能大於陣列長度的,甚至大於陣列的容量。

我們假設 index 取得的隨機數為 4,那麼它大於陣列長度,此時 s[:index] 雖然可以成功,但是 s[index:] 是要失敗的,因此第二次邊界的檢查是有必要的。

你可能會說, index 不是最大值為 3 嗎?怎麼可能是 4呢?

要知道編譯器在編譯的時候,並不知道 index 的最大值是 3 呢。

小結一下

  1. 當陣列的長度和容量相等時,s[:index] 成立能夠保證 s[index:] 也成立,因為只要檢查一次即可
  2. 當陣列的長度和容量不等時,s[:index] 成立不能保證 s[index:] 也成立,因為要檢查兩次才可以

3.4 案例四

有了上面的鋪墊,再來看下面這個示例,由於陣列是呼叫者傳入的引數,所以編譯器的編譯的時候無法得知陣列的長度和容量是否相等,因此只能保險一點,兩個都檢查。

package main

import (
    "math/rand"
)

func f(s []int, index int) {
    _ = s[:index] // 第一次檢查
    _ = s[index:] // 第二次檢查
}

func main()  {}

如果把兩個表示式的順序反過來,就只要做一次檢查就行了

package main

import (
    "math/rand"
)

func f(s []int, index int) {
    _ = s[index:] // 第一次檢查
    _ = s[:index] // 不用檢查
}

func main()  {}

3.5. 主動消除邊界檢查

雖然編譯器已經非常努力去消除一些應該消除的邊界檢查,但難免會有一些遺漏。

這就需要”警民合作”,對於那些編譯器還未考慮到的場景,但開發者又極力追求程式的執行效率的,可以使用一些小技巧給出一些暗示,告訴編譯器哪些地方可以不用做邊界檢查。

比如下面這個示例,從程式碼的邏輯上來說,是完全沒有必要做邊界檢查的,但是編譯器並沒有那麼智慧,實際上每個for迴圈,它都要做一次邊界的檢查,非常的浪費效能。

package main


func f(is []int, bs []byte) {
    if len(is) >= 256 {
        for _, n := range bs {
            _ = is[n] // 每個迴圈都要邊界檢查
        }
    }
}
func main()  {}

可以試著在 for 迴圈前加上這麼一句 is = is[:256] 來告訴編譯器新 is 的長度為 256,最大索引值為 255,不會超過 byte 的最大值,因為 is[n] 從邏輯上來說是一定不會越界的。

package main


func f(is []int, bs []byte) {
    if len(is) >= 256 {
        is = is[:256]
        for _, n := range bs {
            _ = is[n] // 不需要做邊界檢查
        }
    }
}
func main()  {}

3.6 邊界檢查對效能的影響

一直在討論邊界檢查對效能的影響,但是到底影響有多大呢? 不妨以上面的例子做一個基準測試

package main

import "testing"

func f4(is []int, bs []byte) {
	if len(is) >= 256 {
		for _, n := range bs {
			_ = is[n] // 每個迴圈都要邊界檢查
		}
	}
}

func f5(is []int, bs []byte) {
	if len(is) >= 256 {
		for _, n := range bs {
			is = is[:256]
			_ = is[n] // 每個迴圈都要邊界檢查
		}
	}
}

func BenchmarkFunc_f4_test(b *testing.B) {
	s := make([]int, 1000, 10000000)
	bs := []byte{'b', 'a', 'c', 'd', 'e', 'g', 'h', 'j'}
	for i := 0; i < b.N; i++ {
		f4(s, bs)
	}
}

func BenchmarkFunc_f5_test(b *testing.B) {
	s := make([]int, 1000, 10000000)
	bs := []byte{'b', 'a', 'c', 'd', 'e', 'g', 'h', 'j'}
	for i := 0; i < b.N; i++ {
		f5(s, bs)
	}
}

執行基準測試結果如下:

go test -bench=. -benchmem
goos: linux
goarch: amd64
pkg: Go_base/daily_test/bce_demo
BenchmarkFunc_f4_test-8         179074254                6.33 ns/op            0 B/op          0 allocs/op
BenchmarkFunc_f5_test-8         208692784                5.82 ns/op            0 B/op          0 allocs/op
PASS
ok      Go_base/daily_test/bce_demo     3.253s

如上結果,隨著for迴圈次數的增加,其效能有了明顯的差異,對於小的切片,陣列操作時可能效果並不是很明顯,但是如果涉及到資料比較大,或者效能比較嚴苛的地方,避免邊界檢查還是很有必要的。

四. 參考

  1. https://iswbm.com/362.html
  2. https://gfw.go101.org/article/bounds-check-elimination.html

相關文章