golang 幾種字串的連線方式

hatlonely發表於2018-01-26

最近在做效能優化,有個函式裡面的耗時特別長,看裡面的操作大多是一些字串拼接的操作,而字串拼接在 golang 裡面其實有很多種實現。

實現方法

1. 直接使用運算子

func BenchmarkAddStringWithOperator(b *testing.B) {
    hello := "hello"
    world := "world"
    for i := 0; i < b.N; i++ {
        _ = hello + "," + world
    }
}

func BenchmarkAddMoreStringWithOperator(b *testing.B) {
    hello := "hello"
    world := "world"
    for i := 0; i < b.N; i++ {
        var str string
        for i := 0; i < 100; i++ {
            str += hello + "," + world
        }
    }
}

golang 裡面的字串都是不可變的,每次運算都會產生一個新的字串,所以會產生很多臨時的無用的字串,不僅沒有用,還會給 gc 帶來額外的負擔,所以效能比較差

2. fmt.Sprintf()

func BenchmarkAddStringWithSprintf(b *testing.B) {
    hello := "hello"
    world := "world"
    for i := 0; i < b.N; i++ {
        _ = fmt.Sprintf("%s,%s", hello, world)
    }
}

內部使用 []byte 實現,不像直接運算子這種會產生很多臨時的字串,但是內部的邏輯比較複雜,有很多額外的判斷,還用到了 interface,所以效能也不是很好

3. strings.Join()

func BenchmarkAddStringWithJoin(b *testing.B) {
    hello := "hello"
    world := "world"
    for i := 0; i < b.N; i++ {
        _ = strings.Join([]string{hello, world}, ",")
    }
}

join 會先根據字串陣列的內容,計算出一個拼接之後的長度,然後申請對應大小的記憶體,一個一個字串填入,在已有一個陣列的情況下,這種效率會很高,但是本來沒有,去構造這個資料的代價也不小

4. buffer.WriteString()

func BenchmarkAddStringWithBuffer(b *testing.B) {
    hello := "hello"
    world := "world"
    for i := 0; i < b.N; i++ {
        var buffer bytes.Buffer
        buffer.WriteString(hello)
        buffer.WriteString(",")
        buffer.WriteString(world)
        _ = buffer.String()
    }
}

func BenchmarkAddMoreStringWithBuffer(b *testing.B) {
    hello := "hello"
    world := "world"
    for i := 0; i < b.N; i++ {
        var buffer bytes.Buffer
        for i := 0; i < 100; i++ {
            buffer.WriteString(hello)
            buffer.WriteString(",")
            buffer.WriteString(world)
        }
        _ = buffer.String()
    }
}

這個比較理想,可以當成可變字元使用,對記憶體的增長也有優化,如果能預估字串的長度,還可以用 buffer.Grow() 介面來設定 capacity

測試結果

BenchmarkAddStringWithOperator-8                50000000                28.4 ns/op             0 B/op          0 allocs/op
BenchmarkAddStringWithSprintf-8                 10000000               234 ns/op              48 B/op          3 allocs/op
BenchmarkAddStringWithJoin-8                    30000000                56.2 ns/op            16 B/op          1 allocs/op
BenchmarkAddStringWithBuffer-8                  20000000                86.0 ns/op           112 B/op          1 allocs/op
BenchmarkAddMoreStringWithOperator-8              100000             14295 ns/op           58896 B/op        100 allocs/op
BenchmarkAddMoreStringWithBuffer-8                300000              4551 ns/op            5728 B/op          7 allocs/op

這個是在我的自己 Mac 上面跑的結果,go 版本 go version go1.8 darwin/amd64,這個結果僅供參考,還是要以實際生產環境的值為準,程式碼在:<https://github.com/hatlonely/hellogolang/blob/master/internal/buildin/string_test.go>

主要結論

  1. 在已有字串陣列的場合,使用 strings.Join() 能有比較好的效能
  2. 在一些效能要求較高的場合,儘量使用 buffer.WriteString() 以獲得更好的效能
  3. 較少字串連線的場景下效能最好,而且程式碼更簡短清晰,可讀性更好
  4. 如果需要拼接的不僅僅是字串,還有數字之類的其他需求的話,可以考慮 fmt.Sprintf

參考連結

go 語言字串拼接效能分析: <http://herman.asia/efficient-string-concatenation-in-go>

> 轉載請註明出處 > 本文連結:http://hatlonely.com/2018/01/24/golang-/字串的幾種連線方式

更多原創文章乾貨分享,請關注公眾號
  • golang 幾種字串的連線方式
  • 加微信實戰群請加微信(註明:實戰群):gocnio

相關文章