GO語言字串有哪些?詳細分類

老男孩IT教育機構發表於2021-01-06

  

  程式語言有很多,而每個程式語言都離不開字串,那麼你知道GO語言字串有哪些嗎?我們一起來看看吧。

  Go語言的字串是一個用UTF-8編碼的變寬字元序列,它的每一個字元都用一個或多個位元組表示 。

  在Go語言中,沒有字元型別,字元型別是rune型別,rune是int32的別稱。可使用 []byte() 獲取位元組,使用 []rune() 獲取字元,可對中文進行轉換。

  定義字串

  第一種,雙引號,用來建立可解析的字串字面量 (支援轉義,但不能用來引用多行);

  str := "Go語言字串\n不能跨行賦值"

  第二種,反引號,用來建立原生的字串字面量 ,這些字串可能由多行組成(不支援任何轉義序列),原生的字串字面量多用於書寫多行訊息、HTML以及正規表示式。

  str := `Go原生原格式字串

  可以跨行`

  注意:單引號不能用於定義字串,單引號用於定義Go語言的一個特殊型別 rune,類似其他語言的byte但又不完全一樣,是指碼點字面量(Unicode code point),不做任何轉義的原始內容。

  連線字串

  第一種,直接使用 "+" 運算子連結

  str := "hello" + "oldboy"

  golang 裡面的字串都是不可變的,每次運算都會產生一個新的字串,所以會產生很多臨時的無用的字串,不僅沒有用,還會給 gc 帶來額外的負擔,所以效能比較差。

  注意:連線跨行字串時,"+" 必須在上一行末尾,否則導致編譯錯誤。

  第二種,使用 fmt.Sprintf() 連結

  str := fmt.Sprintf("%s,%s", "hello", "oldboy")

  內部使用 []byte 實現,不像直接運算子這種會產生很多臨時的字串,但是內部的邏輯比較複雜,有很多額外的判斷,還用到了 interface,所以效能也不是很好。

  第三種,使用 strings.Join() 連結

  str := strings.Join([]string{"hello", "oldboy"}, ",")

  join會先根據字串陣列的內容,計算出一個拼接之後的長度,然後申請對應大小的記憶體,一個一個字串填入,在已有一個陣列的情況下,這種效率會很高,但是本來沒有,去構造這個資料的代價也不小。

  第四種,使用 buffer.WriteString() 連結

  var buffer bytes.Buffer

  buffer.WriteString("hello")

  buffer.WriteString(",")

  buffer.WriteString("oldboy")

  str := buffer.String()

  這個比較理想,可以當成可變字元使用,對記憶體的增長也有最佳化。

  總結:

  1. 在已有字串陣列的場合,使用 strings.Join() 能有比較好的效能;

  2. 在一些效能要求較高的場合,儘量使用 buffer.WriteString() 以獲得更好的效能;

  3. "+" 運算子在較少字串連線的場景下效能最好,而且程式碼更簡短清晰,可讀性更好;

  4. 如果需要拼接的不僅僅是字串,還有數字之類的其他需求的話,可以考慮 fmt.Sprintf()。

  字串長度

  第一種,將字串轉換為 []rune 後呼叫 len 函式進行統計

  package main

  import (

  "fmt"

  )

  func main() {

  str := "hello oldboy"

  length := len([]rune(str))

  fmt.Println(length)

  }

  在 Golang 中,如果字串中出現中文字元不能直接呼叫 len 函式來統計字串字元長度,這是因為在 Go 中,字串是以 UTF-8 為格式進行儲存的,在字串上呼叫 len 函式,取得的是字串包含的 byte 的個數。

  第二種,使用 bytes.Count() 統計

  func Count(s, sep []byte) int

  計算位元組切片sep在位元組切片s中非重疊顯示的個數,如果 sep 為 nil,則返回 s 中的字元個數 + 1。

  package main

  import (

  "bytes"

  "fmt"

  )

  func main() {

  str := "hello oldboy"

  length := bytes.Count([]byte(str), nil) - 1

  fmt.Println(length)

  }

  第三種,使用 strings.Count() 統計

  func Count(s, sep string) int

  判斷字元sep在字串s中出現的次數,沒有找到則返回-1,如果為空字串("")則返回字串的長度+1。

  package main

  import (

  "fmt"

  "strings"

  )

  func main() {

  str := "hello oldboy"

  length := strings.Count(str, "") - 1

  fmt.Println(length)

  }

  第四種,使用 utf8.RuneCountInString() 統計

  func RuneCountInString(s string) (n int)

  返回 s 字串長度,可以正常解析中文,一箇中文被當做一個字元。

  package main

  import (

  "fmt"

  "unicode/utf8"

  )

  func main() {

  str := "hello oldboy"

  length := utf8.RuneCountInString(str)

  fmt.Println(length)

  }

  字串操作

  使用索引號 "[ ]" 返回子串。 返回的字串依然指向原位元組陣列,僅修改了指標和長度屬性。例項如下:

  package main

  import (

  "fmt"

  )

  func main() {

  str := "hello, oldboy"

  s1 := str[0:5]

  s2 := str[7:13]

  fmt.Println(s1, s2)

  }

  執行結果:

  hello oldboy

  修改字串,可先將其轉換成 []rune 或 []byte,完成後再轉換為 string。無論哪種轉換,都會重新分配記憶體,並複製位元組陣列。例項如下:

  package main

  import "fmt"

  func main() {

  str1 := "hello oldboy"

  s1 := []byte(str1)

  s1[0] = 'H'

  fmt.Println(string(s1))

  str2 := "鳥宿池邊樹,僧推月下門。"

  s2 := []rune(str2)

  s2[7] = '敲'

  fmt.Println(string(s2))

  }

  執行結果:

  Hello oldboy

  鳥宿池邊樹,僧敲月下門。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69952527/viewspace-2747987/,如需轉載,請註明出處,否則將追究法律責任。

相關文章