深度解析 Go 語言中「切片」的三種特殊狀態

老錢發表於2018-11-13

原文網址 : https://juejin.im/post/5bea58df6fb9a049f153bca8

我們今天要來講一個非常細節的小知識，這個知識被大多數 Go 語言的開發者無視了，它就是切片的三種特殊狀態 —— 「零切片」、「空切片」和「nil 切片」。

切片被視為 Go 語言中最為重要的基礎資料結構，使用起來非常簡單，有趣的內部結構讓它成了 Go 語言面試中最為常見的考點。切片的底層是一個陣列，切片的表層是一個包含三個變數的結構體，當我們將一個切片賦值給另一個切片時，本質上是對切片表層結構體的淺拷貝。結構體中第一個變數是一個指標，指向底層的陣列，另外兩個變數分別是切片的長度和容量。

type slice struct {
  array unsafe.Pointer
  length int
  capcity int
}
複製程式碼

我們今天要講的特殊狀態之一「零切片」其實並不是什麼特殊的切片，它只是表示底層陣列的二進位制內容都是零。比如下面程式碼中的 s 變數就是一個「零切片」

var s = make([]int, 10)
fmt.Println(s)
------------
[0 0 0 0 0 0 0 0 0 0]
複製程式碼

如果是一個指標型別的切片，那麼底層陣列的內容就全是 nil

var s = make([]*int, 10)
fmt.Println(s)
------------
[<nil> <nil> <nil> <nil> <nil> <nil> <nil> <nil> <nil> <nil>]
複製程式碼

零切片還是比較易於理解的，這部分我也就不再以鑽牛角尖的形式繼續自我拷問。

下面我們要引入「空切片」和「nil 切片」，在理解它們的區別之前我們先看看一個長度為零的切片都有那些形式可以建立出來

var s1 []int
var s2 = []int{}
var s3 = make([]int, 0)
// new 函式返回是指標型別，所以需要使用 * 號來解引用
var s4 = *new([]int)

fmt.Println(len(s1), len(s2), len(s3), len(s4))
fmt.Println(cap(s1), cap(s2), cap(s3), cap(s4))
fmt.Println(s1, s2, s3, s4)

----------------
0 0 0 0
0 0 0 0
[] [] [] []
複製程式碼

上面這四種形式從輸出結果上來看，似乎一摸一樣，沒區別。但是實際上是有區別的，我們要講的兩種特殊型別「空切片」和「 nil 切片」，就隱藏在上面的四種形式之中。

我們如何來分析三面四種形式的內部結構的區別呢？接下里要使用到 Go 語言的高階內容，通過 unsafe.Pointer 來轉換 Go 語言的任意變數型別。

因為切片的內部結構是一個結構體，包含三個機器字大小的整型變數，其中第一個變數是一個指標變數，指標變數裡面儲存的也是一個整型值，只不過這個值是另一個變數的記憶體地址。我們可以將這個結構體看成長度為 3 的整型陣列 [3]int。然後將切片變數轉換成 [3]int。

var s1 []int
var s2 = []int{}
var s3 = make([]int, 0)
var s4 = *new([]int)

var a1 = *(*[3]int)(unsafe.Pointer(&s1))
var a2 = *(*[3]int)(unsafe.Pointer(&s2))
var a3 = *(*[3]int)(unsafe.Pointer(&s3))
var a4 = *(*[3]int)(unsafe.Pointer(&s4))
fmt.Println(a1)
fmt.Println(a2)
fmt.Println(a3)
fmt.Println(a4)

---------------------
[0 0 0]
[824634199592 0 0]
[824634199592 0 0]
[0 0 0]
複製程式碼

從輸出中我們看到了明顯的神奇的讓人感到意外的難以理解的不一樣的結果。

其中輸出為 [0 0 0] 的 s1 和 s4 變數就是「 nil 切片」，s2 和 s3 變數就是「空切片」。824634199592 這個值是一個特殊的記憶體地址，所有型別的「空切片」都共享這一個記憶體地址。

var s2 = []int{}
var s3 = make([]int, 0)

var a2 = *(*[3]int)(unsafe.Pointer(&s2))
var a3 = *(*[3]int)(unsafe.Pointer(&s3))
fmt.Println(a2)
fmt.Println(a3)

var s5 = make([]struct{ x, y, z int }, 0)
var a5 = *(*[3]int)(unsafe.Pointer(&s5))
fmt.Println(a5)

--------
[824634158720 0 0]
[824634158720 0 0]
[824634158720 0 0]
複製程式碼

用圖形來表示「空切片」和「 nil 切片」如下

空切片指向的 zerobase 記憶體地址是一個神奇的地址，從 Go 語言的原始碼中可以看到它的定義

//// runtime/malloc.go

// base address for all 0-byte allocations
var zerobase uintptr

// 分配物件記憶體
func mallocgc(size uintptr, typ *_type, needzero bool) unsafe.Pointer {
	...
	if size == 0 {
		return unsafe.Pointer(&zerobase)
	}
    ...
}

//// runtime/slice.go
// 建立切片
func makeslice(et *_type, len, cap int) slice {
  ...
     p := mallocgc(et.size*uintptr(cap), et, true)
	 return slice{p, len, cap}
}
複製程式碼

最後一個問題是：「 nil 切片」和「空切片」在使用上有什麼區別麼？

答案是完全沒有任何區別！No！不對，還有一個小小的區別！請看下面的程式碼

package main

import "fmt"

func main() {
	var s1 []int
	var s2 = []int{}

	fmt.Println(s1 == nil)
	fmt.Println(s2 == nil)

	fmt.Printf("%#v\n", s1)
	fmt.Printf("%#v\n", s2)
}

-------
true
false
[]int(nil)
[]int{}
複製程式碼

所以為了避免寫程式碼的時候把腦袋搞昏的最好辦法是不要建立「空切片」，統一使用「 nil 切片」，同時要避免將切片和 nil 進行比較來執行某些邏輯。這是官方的標準建議。

The former declares a nil slice value, while the latter is non-nil but zero-length. They are functionally equivalent—their len and cap are both zero—but the nil slice is the preferred style.

「空切片」和「 nil 切片」有時候會隱藏在結構體中，這時候它們的區別就被太多的人忽略了，下面我們看個例子

type Something struct {
	values []int
}

var s1 = Something{}
var s2 = Something{[]int{}}
fmt.Println(s1.values == nil)
fmt.Println(s2.values == nil)

--------
true
false
複製程式碼

可以發現這兩種建立結構體的結果是不一樣的！

「空切片」和「 nil 切片」還有一個極為不同的地方在於 JSON 序列化

type Something struct {
	Values []int
}

var s1 = Something{}
var s2 = Something{[]int{}}
bs1, _ := json.Marshal(s1)
bs2, _ := json.Marshal(s2)
fmt.Println(string(bs1))
fmt.Println(string(bs2))

---------
{"Values":null}
{"Values":[]}
複製程式碼

Ban! Ban! Ban! 它們的 json 序列化結果居然也不一樣！

掃一掃二維碼閱讀《快學 Go 語言》更多章節

Go 語言切片的三種特殊狀態 —— 90% 的開發者都忽視了
2018-11-21
Go
Go 語言中的切片 --slice
2024-10-24
Go
聊聊Go語言中的陣列與切片
2022-12-01
Go陣列
Go語言中切片slice的宣告與使用
2020-10-01
Go
Go 語言中的兩種 slice 表示式
2019-03-25
Go
Go 語言中常見的幾種反模式
2021-03-31
Go模式
Go語言中的加解密利器：go-crypto庫全解析
2024-11-25
Go解密
Go 語言中的方法
2020-08-20
Go
c語言中陣列的三種型別
2021-09-11
C語言陣列型別
c語言中的三種迴圈語句結構
2024-07-27
C語言
go 語言切片
2018-07-16
Go
Go 語言中的 collect 使用
2020-04-10
Go
Go 語言中的外掛
2021-09-07
Go
Go語言系列(三)之陣列和切片
2020-08-01
Go陣列
解析C語言中的sizeof
2020-04-06
C語言
Go語言————7.2 切片
2018-07-01
Go
GO 語言中的物件導向
2020-03-05
Go物件
Go語言中的併發模式
2024-11-03
Go模式
dart系列之:dart語言中的特殊操作符
2021-11-12
Dart
Go語言中用 os/exec 執行命令的五種姿勢
2022-01-05
Go
Go語言中的變數作用域
2019-01-14
Go變數
Go語言中的單元測試
2019-02-19
Go
認識 Go 語言中的陣列
2021-09-09
Go陣列
Go 語言中使用 ETCD
2020-06-23
Go
郵件介面推送的三種狀態方式
2019-06-04
GO語言————8.4 map 型別的切片
2018-07-03
Go型別
Go 語言切片是如何擴容的？
2023-04-09
Go
go語言之陣列與切片
2019-01-25
Go陣列
GO語言學習——切片二
2022-04-29
Go
Go語言中defer的一些坑
2018-09-14
Go
9.Go語言中的流程控制
2024-03-23
Go
Go 語言中的格式化輸出
2019-12-22
Go
詳細解讀go語言中的chnanel
2021-09-09
GoNaN
Go語言中時間輪的實現
2021-02-13
Go
hash 表在 go 語言中的實現
2021-04-16
Go
Go 語言中 strings 包常用方法
2020-04-12
Go
GO語言————7.5 切片的複製與追加
2018-07-01
Go
go 語言中預設的型別識別
2018-06-04
Go型別

深度解析 Go 語言中「切片」的三種特殊狀態

相關文章