golang如何使用指標靈活操作記憶體？unsafe包原理解析

golang架构师k哥發表於2024-06-22

原文網址 : https://www.cnblogs.com/killianxu/p/18262567

Golang指標記憶體

Hi 你好，我是k哥。一個大廠工作6年，還在繼續搬磚的後端程式設計師。

我們都知道，C/C++提供了強大的萬能指標void*，任何型別的指標都可以和萬能指標相互轉換。並且指標還可以進行加減等算數操作。那麼在Golang中，是否有類似的功能呢？答案是有的，這就是我們今天要探討的unsafe包。

本文將深入探討unsafe包的功能和原理。同時，我們學習某種東西，一方面是為了實踐運用，另一方面則是出於功利性面試的目的。所以，本文還會為大家介紹unsafe 包的典型應用以及高頻面試題。

功能

為了實現靈活操作記憶體的目的，unsafe包主要提供了4個功能：

定義了Pointer型別，任何型別的指標都可和Pointer互相轉換，類似於c語言中的void*

var a int = 1
p := unsafe.Pointer(&a) // 其它型別指標轉Pointer
b := (*int)(p) // Pointer型別轉其它型別指標
fmt.Println(*b) // 輸出1

定義了uintptr型別，Pointer和uintptr可以互相轉換， 從而實現指標的加減等算數運算。

type Person struct {
    age int
    name string
}
person := Person{age:18,name:"k哥"}
p := unsafe.Pointer(&person) // 其它型別指標轉Pointer
u := uintptr(p) // Pointer型別轉為uintptr
u=u+8 // uintptr加減操作
pName := unsafe.Pointer(u) // uintptr轉換為Pointer
name := *(*string)(pName)
fmt.Println(name) // 輸出k哥

uintptr是用於指標運算的，它只是一個儲存一個 指標地址 的 int 型別，GC 不把 uintptr 當指標，因此， uintptr 型別的目標可能會被回收

獲取任意型別記憶體對齊、偏移量和記憶體大小。

func Alignof(x ArbitraryType) uintptr // 記憶體對齊
func Offsetof(x ArbitraryType) uintptr // 記憶體偏移量
func Sizeof(x ArbitraryType) uintptr // 記憶體大小

Alignof 返回型別x的記憶體地址對齊值m，這個型別在記憶體中的地址必須是m的倍數(基於記憶體讀寫效能的考慮)。
Offsetof 返回結構體成員x在記憶體中的位置離結構體起始處(結構體的第一個欄位的偏移量都是0)的位元組數，即偏移量。
Sizeof 返回型別 x 所佔據的位元組數，如果型別x結構有指標，Sizeof不包含 x 指標成員所指向內容的大小。

ArbitraryType是佔位符，golang編譯器在編譯時會替換為具體型別

高效能型別轉換。

func Slice(ptr *ArbitraryType, len IntegerType) []ArbitraryType
func SliceData(slice []ArbitraryType) *ArbitraryType
func String(ptr *byte, len IntegerType) string 
func StringData(str string) *byte

Slice 傳入任意型別的指標和長度，返回該型別slice變數
SliceData 傳入任意型別的slice變數，返回該slice底層陣列的指標。
String 從一個byte指標派生出一個指定長度的字串。
StringData 用來獲取一個字串底層位元組序列中的第一個byte的指標。

高效能型別轉換原理

為什麼說Slice、SliceData、String、StringData是高效能型別轉換函式呢?下面我們就來剖析下它們的實現原理。

本文以String和StringData函式為例，Slice和SliceData函式實現原理類似。在介紹函式實現原理之前，先認識下string型別的底層資料結構StringHeader。string型別會被Golang編譯器編譯成此結構，其中Data是byte陣列地址，Len是字串長度。

type StringHeader struct {
        Data uintptr // byte陣列地址
        Len  int // 字串長度
}

String函式會被Go編譯成下面的函式實現邏輯。我們可以發現，ptr指標轉換為string型別，是直接將ptr賦值給StringHeader的成員Data，而不需要重新複製ptr指向的byte陣列。從而透過零複製實現高效能型別轉換。

import (
    "fmt"
    "reflect"
    "unsafe"
)

func String(ptr *byte, len int) string {
    p := (uintptr)(unsafe.Pointer(ptr))
    hdr := &reflect.StringHeader{
        Data: p,
        Len:  len,
    }
    // 將 StringHeader 轉為 string
    str := *(*string)(unsafe.Pointer(hdr))
    return str
}

func main() {
    bytes := []byte{'h', 'e', 'l', 'l', 'o'}
    ptr := &bytes[0]
    len := 5
    str := String(ptr, len)
    fmt.Println(str) // 輸出hello
}

StringData函式會被Go編譯成下面的函式實現邏輯。同理，我們可以發現，string型別轉換為byte，是直接取StringHeader的uintptr型別成員Data，並將其轉換為byte。不需要複製整個string，重新生成byte陣列。從而透過零複製實現高效能型別轉換。

import (
    "fmt"
    "reflect"
    "unsafe"
)

func StringData(str string) *byte {
    hdr := (*reflect.StringHeader)(unsafe.Pointer(&str))
    data := hdr.Data
    return (*byte)(unsafe.Pointer(data))
}

func main() {
    str := "hello"
    data := StringData(str)
    fmt.Println(string(*data)) // 輸出h
}

回到問題，為什麼說Slice、SliceData、String、StringData是高效能型別轉換函式呢？透過String和StringData函式的實現邏輯，我們可以知道，String和StringData利用unsafe包，透過零複製，實現了高效能型別轉換。

典型應用

在實踐中，常見使用unsafe包的場景有2個：

與作業系統以及非go編寫(cgo)的程式碼通訊。

func SetData(bytes []byte) { 
    cstr := (*C.char)(unsafe.Pointer(&bytes[0])) // 轉換成一個C char型別
    C.setData(cstr, (C.int)(len(bytes))) // 呼叫C語言函式
}

高效能型別轉換。

func Bytes2String(b []byte) string {
    return *(*string)(unsafe.Pointer(&b))
}

func String2Bytes(s string) []byte {
    sh := (*reflect.StringHeader)(unsafe.Pointer(&s))
    bh := reflect.SliceHeader{
        Data: sh.Data,
        Len:  sh.Len,
        Cap:  sh.Len,
    }
    return *(*[]byte)(unsafe.Pointer(&bh))
}

高頻面試題

能說說uintptr和unsafe.Pointer的區別嗎？
字串轉成byte陣列，會發生記憶體複製嗎？

歡迎大家關注我的公粽號【golang架構師k哥】，每週分享golang和架構師技能。

golang 垃圾回收器如何標記記憶體？
2021-06-29
Golang記憶體
深入理解golang：記憶體分配原理
2020-11-04
Golang記憶體
C語言重點——指標篇（一文讓你完全搞懂指標）| 從記憶體理解指標 | 指標完全解析
2020-11-07
C語言指標記憶體
C++ 指標動態記憶體分配
2024-05-09
C++指標記憶體
指標：存放記憶體地址的變數
2024-08-16
指標記憶體變數
函式指標、回撥函式、動態記憶體分配、檔案操作
2024-11-04
函式指標記憶體
C++ 引用和指標：記憶體地址、建立方法及應用解析
2024-04-11
C++指標記憶體
golang工作筆記（一）指標
2019-09-07
Golang筆記指標
Golang 共享記憶體
2020-02-24
Golang記憶體
GC最佳化：棧記憶體、span、NativeMemory、指標、池化記憶體筆記
2024-11-16
GC記憶體指標筆記
golang二級指標操作連結串列
2018-08-31
Golang指標
Java 8 記憶體管理原理解析及記憶體故障排查實踐
2024-03-21
Java記憶體
c語言野指標與結構體指標動態記憶體分配小解
2020-12-11
C語言指標結構體記憶體
JavaScript閉包（記憶體洩漏、溢位以及記憶體回收），超直白解析
2020-08-29
JavaScript記憶體
Golang中如何正確的使用sarama包操作Kafka？
2021-08-12
GolangKafka
golang指標
2020-10-17
Golang指標
007 LeakCanary 記憶體洩漏原理完全解析
2019-03-03
記憶體
c++動態記憶體管理與智慧指標
2022-03-01
C++記憶體指標
[譯]Unsafe Swift – 指標與C互動
2019-03-03
Swift指標
golang flag包使用筆記
2021-09-09
Golang筆記
如何靈活使用 Hyperf dependencies 配置
2020-01-19
golang手動管理記憶體
2018-04-27
Golang記憶體
MongoDB 如何使用記憶體？為什麼記憶體滿了？
2019-01-10
MongoDB記憶體
MongoDB如何使用記憶體？為什麼記憶體滿了？
2019-01-08
MongoDB記憶體
Golang : cobra 包解析
2019-05-16
Golang
Golang指標基本介紹及使用案例
2018-08-10
Golang指標
如何檢視linux系統中空閒記憶體/實體記憶體使用/剩餘記憶體
2018-09-20
Linux記憶體
Go unsafe包
2022-01-12
Go
【記憶體管理】Oracle如何使用ASMM自動共享記憶體管理
2020-12-03
記憶體OracleASM
Go指標探秘：深入理解記憶體與安全性
2023-09-24
Go指標記憶體
golang 切片記憶體應用技巧
2019-12-12
Golang記憶體
記憶體洩漏的定位與排查：Heap Profiling 原理解析
2021-11-23
記憶體
C語言第九周作業（指標變數，記憶體訪問，取址，空指標）
2020-11-03
C語言指標變數記憶體
重磅硬核 | 一文聊透物件在 JVM 中的記憶體佈局，以及記憶體對齊和壓縮指標的原理及應用
2022-07-06
物件JVM記憶體指標
Linux記憶體不夠了？看看如何開啟虛擬記憶體增加記憶體使用量
2024-07-02
Linux記憶體
如何在 Laravel 中靈活的使用 Trait
2019-02-26
LaravelAI
常用記憶體操作函式
2020-12-21
記憶體函式
Redis 記憶體壓縮原理
2020-08-02
Redis記憶體

golang如何使用指標靈活操作記憶體？unsafe包原理解析

功能

高效能型別轉換原理

典型應用

高頻面試題

相關文章