Slice在使用過程中需要懂的一些資料結構

水墨先生發表於2021-10-05

原始碼包中src/runtime/slice.go:slice 定義了Slice的資料結構,從資料結構看Slice很清晰, array指標指向底層陣列,len表示切片長度,cap表示底層陣列容量:

type slice struct {
    array unsafe.Pointer
    len int
    cap int
}

下圖使用make來建立Slice時,可以同時指定長度和容量,建立時底層會分配一個陣列,陣列的長度即容量。 例如,語句 slice := make([]int, 5, 10) 所建立的Slice,結構所示:

Slice在使用過程中需要懂的一些資料結構

  • 上圖可以理解Slice長度為5,即可以使用下標slice[0] ~ slice[4]來操作裡面的元素,capacity為10,表示後續向slice新增新的元素時可以不必重新分配記憶體,直接使用預留記憶體即可

使用陣列來建立Slice時,Slice將與原陣列共用一部分記憶體。
例如,語句slice := array[5:7] 所建立的Slice,結構如下圖所示:

Slice在使用過程中需要懂的一些資料結構

  • 切片從陣列array[5]開始,到陣列array[7]結束(不含array[7],即切片長度為2,陣列後面的內容都作為切片的預留記憶體,即capacity為5。陣列和切片操作可能作用於同一塊記憶體,這也是使用過程中需要注意的地方。

Slice如何擴容?

  • 使用append向Slice追加元素時,如果Slice空間不足,將會觸發Slice擴容,擴容實際上重新一配一塊更大的記憶體,將原Slice資料拷貝進新Slice,然後返回新Slice,擴容後再將資料追加進去。
    下圖演示了當向一個capacity為5,length也為5的Slice再次追加1個元素時,就會發生擴容,如下圖所示:

Slice在使用過程中需要懂的一些資料結構

  • 上圖可見:擴容操作只關心容量,會把原Slice資料拷貝到新Slice,追加資料由append在擴容結束後完成。擴容後新Slice長度仍然是5,但容量由5提升到了10,原Slice的資料也都拷貝到了新Slice指向的陣列中。

Slice擴容容量是遵循以下規則進行:

  • 如果原Slice容量小於1024,則新Slice容量將擴大為原來的2倍;
  • 如果原Slice容量大於等於1024,則新Slice容量將擴大為原來的1.25倍;

使用append()向Slice新增一個元素的實現步驟如下:

  • 假如Slice容量夠用,則將新元素追加進去,Slice.len++,返回原Slice
  • 原Slice容量不夠,則將Slice先擴容,擴容後得到新Slice
  • 將新元素追加進新Slice,Slice.len++,返回新的Slice。

使用Copy操作Slice會不會擴容?

  • 使用copy()內建函式拷貝兩個切片時,會將源切片的資料逐個拷貝到目的切片指向的陣列中,拷貝數量取兩個切片長度的最小值。例如長度為10的切片拷貝到長度為5的切片時,將會拷貝5個元素。也就是說,copy過程中不會發生擴容。

跟據陣列或切片生成新的切片是一種比較特殊的切片,這種新生成的切片並沒有指定切片的容量,實際上新切片的容量是從start開始直至array的結束。

  • 比如下面兩個切片,長度和容量都是一致的,使用共同的記憶體地址:
    sliceA := make([]int, 5, 10)
    sliceB := sliceA[0:5]

根據陣列或切片生成切片還有另一種寫法,即切片同時也指定容量,即slice[start,end,cap], 其中cap即為新切片的容量,當然容量不能超過原切片實際值,如下所示:

sliceA := make([]int, 5, 10) //length = 5; capacity = 10
sliceB := sliceA[0:5] //length = 5; capacity = 10
sliceC := sliceA[0:5:5] //length = 5; capacity = 5

使用切片的注意事項:

  • 建立切片時可跟據實際需要預分配容量,儘量避免追加過程中擴容操作,有利於提升效能;
  • 切片拷貝時需要判斷實際拷貝的元素個數
  • 謹慎使用多個切片操作同一個陣列,以防讀寫衝突

最後總結一下我對切片的理解,如有不足之處討論區告知:

  • 每個切片都指向一個底層陣列
  • 每個切片都儲存了當前切片的長度、底層陣列可用容量
  • 使用len()計算切片長度不需要遍歷切片
  • 使用cap()計算切片容量不需要遍歷切片
  • 通過函式傳遞切片時,不會拷貝整個切片,因為切片本身只是個結構體
  • 使用append()向切片追加元素時有可能觸發擴容,擴容後將會生成新的切片
本作品採用《CC 協議》,轉載必須註明作者和本文連結

相關文章