0.1、索引
waterflow.link/articles/1664080524...
1、未知的列舉值
我們現在定義一個型別是unit32的Status,他可以作為列舉型別,我們定義了3種狀態
type Status uint32
const (
StatusOpen Status = iota
StatusClosed
StatusUnknown
)
其中我們使用了iota,相關的用法自行google。最終對應的狀態就是:
0-開啟狀態,1-關閉狀態,2-未知狀態
現在我們假設有一個請求引數過來,資料結構如下:
{
"Id": 1234,
"Timestamp": 1563362390,
"Status": 1
}
可以看到是一個json型別的字串,其中就包含了Status狀態,我們的請求是希望把狀態修改為關閉狀態。
然後我們在服務端建立一個結構體,方便把這些欄位解析出來:
type Request struct {
ID int `json:"Id"`
Timestamp int `json:"Timestamp"`
Status Status `json:"Status"`
}
好了,我們在main中執行下程式碼,看下解析是否正確:
package main
import (
"encoding/json"
"fmt"
)
type Status uint32
const (
StatusOpen Status = iota
StatusClosed
StatusUnknown
)
type Request struct {
ID int `json:"Id"`
Timestamp int `json:"Timestamp"`
Status Status `json:"Status"`
}
func main() {
js := `{
"Id": 1234,
"Timestamp": 1563362390,
"Status": 1
}`
request := &Request{}
err := json.Unmarshal([]byte(js), request)
if err != nil {
fmt.Println(err)
return
}
}
執行後的結果如下:
go run main.go
&{1234 1563362390 1}
可以看到解析是沒問題的。
然而,讓我們再提出一個未設定狀態值的請求(無論出於何種原因):
{
"Id": 1234,
"Timestamp": 1563362390
}
在這種情況下,請求結構的狀態欄位將被初始化為其零值(對於 uint32 型別:0)。因此,StatusOpen 而不是 StatusUnknown。
最佳實踐是將列舉的未知值設定為 0:
type Status uint32
const (
StatusUnknown Status = iota
StatusOpen
StatusClosed
)
在這裡,如果狀態不是 JSON 請求的一部分,它將被初始化為 StatusUnknown,正如我們所期望的那樣。
2、指標無處不在?
按值傳遞變數將建立此變數的副本。而透過指標傳遞它只會複製記憶體地址。
因此,傳遞指標總是會更快,對麼?
如果你相信這一點,請看看這個例子。這是一個 0.3 KB 資料結構的基準測試,我們透過指標和值傳遞和接收。 0.3 KB 並不大,但這與我們每天看到的資料結構型別(對於我們大多數人來說)應該相差不遠。
當我在本地環境中執行這些基準測試時,按值傳遞比按指標傳遞快 4 倍以上。這可能有點違反直覺,對吧?
這其實與 Go 中如何管理記憶體有關。我們都知道變數可以分配在堆上或棧上,也知道:
- 棧包含給定 goroutine 的正在進行的變數。一旦函式返回,變數就會從堆疊中彈出。
- 堆包含共享變數(全域性變數等)。
讓我們看下下面這個簡單的例子:
type foo struct{}
func getFooValue() foo {
var result foo
// Do something
return result
}
這裡,一個結果變數由當前的 goroutine 建立。這個變數被壓入當前堆疊。一旦函式返回,客戶端將收到此變數的副本。變數本身從堆疊中彈出。它仍然存在於記憶體中,直到它被另一個變數擦除,但它不能再被訪問。
我們現在修改下上面的例子,使用指標:
type foo struct{}
func getFooPointer() *foo {
var result foo
// Do something
return &result
}
結果變數仍然由當前的 goroutine 建立,但客戶端將收到一個指標(變數地址的副本)。如果結果變數從堆疊中彈出,則此函式的客戶端無法再訪問它。
在這種情況下,Go 編譯器會將結果變數轉移到可以共享變數的地方:堆。
但是,傳遞指標是另一種情況。例如:
type foo struct{}
func main() {
p := &foo{}
f(p)
}
因為我們在同一個 goroutine 中呼叫 f,所以 p 變數不需要被轉移。它只是被壓入堆疊,子函式可以訪問它。
比如在 io.Reader 的 Read 方法中接收切片而不是返回切片的直接結果,也不會轉移到堆上。
但是返回一個切片(它是一個指標)會將其轉移到堆中。
為什麼堆疊那麼快?主要原因有兩個:
- 堆疊不需要垃圾收集器。正如我們所說,一個變數在建立後被簡單地壓入,然後在函式返回時從堆疊中彈出。無需進行復雜的過程來回收未使用的變數等。
- 堆疊屬於一個 goroutine,因此與將變數儲存在堆上相比,儲存變數不需要同步。這也導致效能增益。
結論就是:
當我們建立一個函式時,我們的預設行為應該是使用值而不是指標。僅當我們想要共享變數時才應使用指標。
最後:
如果我們遇到效能問題,一種可能的最佳化可能是檢查指標在某些特定情況下是否有幫助。使用以下命令可以知道編譯器何時將變數轉移到堆中:go build -gcflags “-m -m”。(記憶體逃逸)
3、中斷 for/switch 或 for/select
我們看下下面的程式碼會發生什麼:
package main
func f() bool {
return true
}
func main() {
for {
switch f() {
case true:
break
case false:
// Do something
}
}
}
我們將呼叫 break 語句。但是,這會破壞 switch 語句,而不是 for 迴圈。
相同的情況還會出現在fo/select中,像下面這樣:
package main
import (
"context"
"time"
)
func main() {
ch := make(chan struct{})
ctx, cancel := context.WithTimeout(context.Background(), 2*time.Second)
defer cancel()
for {
select {
case <-ch:
// Do something
case <-ctx.Done():
break
}
}
}
雖然呼叫了break,但是還是會陷入死迴圈。break 與 select 語句有關,與 for 迴圈無關。
打破 for/switch 或 for/select 的,一種方案是直接return結束整個函式,下面如果還有程式碼不會被執行。
package main
import (
"context"
"fmt"
"time"
)
func main() {
ch := make(chan struct{})
ctx, cancel := context.WithTimeout(context.Background(), 2*time.Second)
defer cancel()
for {
select {
case <-ch:
// Do something
case <-ctx.Done():
return
}
}
// 這裡不會執行
fmt.Println("done")
}
還有一種方案是使用中斷標記
package main
import (
"context"
"fmt"
"time"
)
func main() {
ch := make(chan struct{})
ctx, cancel := context.WithTimeout(context.Background(), 2*time.Second)
defer cancel()
loop:
for {
select {
case <-ch:
// Do something
case <-ctx.Done():
break loop
}
}
// 會繼續往下執行
fmt.Println("done")
}
4、錯誤管理
一個錯誤應該只處理一次。記錄錯誤就是處理錯誤。因此,應該記錄或傳播錯誤。
我們可能希望為錯誤新增一些上下文並具有某種形式的層次結構。
讓我們看一個介面請求資料庫的例子,我們分為介面層,service層和類庫層。我們希望返回的層次結構像下面這樣:
unable to serve HTTP POST request for id 1
|_ unable to insert customer
|_ unable to commit transaction
如果我們使用 pkg/errors,我們可以這樣做:
package main
import (
"fmt"
"github.com/pkg/errors"
)
func postHandler(id int) string {
err := insert(id)
if err != nil {
fmt.Printf("unable to serve HTTP POST request for id %d\n", id)
return `{ok: false}`
}
return `{ok: true}`
}
func insert(id int) error {
err := dbQuery(id)
if err != nil {
return errors.Wrapf(err, "unable to insert customer")
}
return nil
}
func dbQuery(id int) error {
// Do something then fail
return errors.New("unable to commit transaction")
}
func main() {
res := postHandler(1)
fmt.Println(res)
}
初始錯誤(如果不是由外部庫返回)可以使用 errors.New 建立。service層 insert 透過向其新增更多上下文來包裝此錯誤。然後,介面層透過記錄錯誤來處理錯誤。每個級別都返回或處理錯誤。
例如,我們可能還想檢查錯誤原因本身以實現重試。假設我們有一個來自處理資料庫訪問的外部庫的 db 包。這個庫可能會返回一個名為 db.DBError 的暫時(臨時)錯誤。要確定是否需要重試,我們必須檢查錯誤原因:
package main
import (
"fmt"
"github.com/pkg/errors"
)
type DbError struct {
msg string
}
func (e *DbError) Error() string {
return e.msg
}
func postHandler(id int) string {
err := insert(id)
if err != nil {
errCause := errors.Cause(err)
if _, ok := errCause.(*DbError); ok {
fmt.Println("retry")
} else {
fmt.Printf("unable to serve HTTP POST request for id %d\n", id)
return `{ok: false}`
}
}
return `{ok: true}`
}
func insert(id int) error {
err := dbQuery(id)
if err != nil {
return errors.Wrapf(err, "unable to insert customer")
}
return nil
}
func dbQuery(id int) error {
// Do something then fail
return &DbError{"unable to commit transaction"}
}
func main() {
res := postHandler(1)
fmt.Println(res)
}
這是使用errors.Cause完成的,它也來自pkg/errors。(可以透過errors.Cause檢查。 errors.Cause 將遞迴檢索沒有實現causer 的最頂層錯誤,這被認為是原始原因。)
有時候也會有人這麼用。例如,檢查錯誤是這樣完成的:
package main
import (
"fmt"
"github.com/pkg/errors"
)
type DbError struct {
msg string
}
func (e *DbError) Error() string {
return e.msg
}
func postHandler(id int) string {
err := insert(id)
if err != nil {
switch err.(type) {
default:
fmt.Printf("unable to serve HTTP POST request for id %d\n", id)
return `{ok: false}`
case *DbError:
fmt.Println("retry")
}
}
return `{ok: true}`
}
func insert(id int) error {
err := dbQuery(id)
if err != nil {
return errors.Wrapf(err, "unable to insert customer")
}
return nil
}
func dbQuery(id int) error {
// Do something then fail
return &DbError{"unable to commit transaction"}
}
func main() {
res := postHandler(1)
fmt.Println(res)
}
如果 DBError 被包裝,它永遠不會觸發重試。
5、切片初始化
有時,我們知道切片的最終長度是多少。例如,假設我們要將 Foo 的切片轉換為 Bar 的切片,這意味著這兩個切片將具有相同的長度。
我們有時候經常會這樣初始化切片:
var bars []Bar
bars := make([]Bar, 0)
我們都知道切片的底層是陣列。如果沒有更多可用空間,它會實施增長戰略。在這種情況下,會自動建立一個新陣列(容量更大)並複製所有元素。
現在,假設我們需要多次重複這個增長操作,因為我們的 []Foo 包含數千個元素?插入的攤銷時間複雜度(平均值)將保持為 O(1),但在實踐中,它會對效能產生影響。
因此,如果我們知道最終長度,我們可以:
使用預定義的長度對其進行初始化:
func convert(foos []Foo) []Bar { bars := make([]Bar, len(foos)) for i, foo := range foos { bars[i] = fooToBar(foo) } return bars }
或者使用 0 長度和預定義容量對其進行初始化:
func convert(foos []Foo) []Bar { bars := make([]Bar, 0, len(foos)) for _, foo := range foos { bars = append(bars, fooToBar(foo)) } return bars }
選哪個更好呢?第一個稍微快一點。然而,你可能更喜歡第二個,因為無論我們是否知道初始大小,在切片末尾新增一個元素都是使用 append 完成的。
6、上下文管理
context.Context
對我們來說非常好用,他可以在協程之間傳遞資料、可以控制協程的生命週期等等。但是這也造成了它的濫用。
go官方文件是這麼定義的:
==一個 Context 攜帶一個截止日期、一個取消訊號和其他跨 API 邊界的值。==
這個描述很寬泛,足以讓一些人對為什麼以及如何使用它感到困惑。
讓我們試著詳細說明一下。上下文可以攜帶:
- 一個截止時間。它意味著一個持續時間(例如 250 毫秒)或日期時間(例如 2022-01-08 01:00:00),我們認為如果達到,我們必須取消正在進行的活動(I/O 請求,等待通道輸入等)。
- 取消訊號(基本上是 <-chan struct{})。 在這裡,行為是相似的。 一旦我們收到訊號,我們必須停止正在進行的活動。 例如,假設我們收到兩個請求。 一個插入一些資料,另一個取消第一個請求(因為它不再需要)。 這可以透過在第一次呼叫中使用可取消上下文來實現,一旦我們收到第二個請求,該上下文將被取消。
- 鍵/值列表(均基於 interface{} 型別)。
另外需要說明的是。
首先,上下文是可組合的。因此,我們可以有一個包含截止日期和鍵/值列表的上下文。
此外,多個 goroutine 可以共享相同的上下文,因此取消訊號可能會停止多個活動。
我們可以看下一個具體的錯誤例子
一個 Go 應用程式是基於 urfave/cli 的(如果你不知道,那是一個在 Go 中建立命令列應用程式的好庫)。一旦開始,開發人員就會繼承某種應用程式上下文。這意味著當應用程式停止時,庫將使用此上下文傳送取消訊號。
我瞭解的是,這個上下文是在呼叫 gRPC 端點時直接傳遞的。這不是我們想要做的。
相反,我們想向 gRPC 庫傳遞:請在應用程式停止時或在 100 毫秒後取消請求。
為此,我們可以簡單地建立一個組合上下文。如果 parent 是應用程式上下文的名稱(由 urfave/cli 建立),那麼我們可以簡單地這樣做:
package main
import (
"context"
"fmt"
"log"
"os"
"time"
"github.com/urfave/cli/v2"
)
func main() {
app := &cli.App{
Name: "boom",
Usage: "make an explosive entrance",
Action: func(parent *cli.Context) error {
// 父上下文傳進來,給個超時時間
ctx, cancel := context.WithTimeout(parent.Context, 10*time.Second)
defer cancel()
grpcClientSend(ctx)
return nil
},
}
if err := app.Run(os.Args); err != nil {
log.Fatal(err)
}
}
func grpcClientSend(ctx context.Context) {
for {
select {
case <-ctx.Done(): // 達到超時時間就結束
fmt.Println("cancel!")
return
default:
time.Sleep(2 * time.Second)
fmt.Println("do something!")
}
}
}
7、使用檔名作為函式輸入?
假設我們必須實現一個函式來計算檔案中的空行數。一般我們是這樣實現的:
package main
import (
"bufio"
"fmt"
"os"
"github.com/pkg/errors"
)
func main() {
cou, err := count("a.txt")
if err != nil {
fmt.Println(err)
return
}
fmt.Println(cou)
}
func count(filename string) (int, error) {
file, err := os.Open(filename)
if err != nil {
return 0, errors.Wrapf(err, "unable to open %s", filename)
}
defer file.Close()
scanner := bufio.NewScanner(file)
count := 0
for scanner.Scan() {
if scanner.Text() == "" {
count++
}
}
return count, nil
}
檔名作為輸入給出,所以我們開啟它然後我們實現我們的邏輯,對吧?
現在,假設我們要在此函式之上實現單元測試,以測試普通檔案、空檔案、具有不同編碼型別的檔案等。這很容易變得非常難以管理。
此外,如果我們想要對http body實現相同的邏輯,我們將不得不為此建立另一個函式。
Go 帶有兩個很棒的抽象:io.Reader 和 io.Writer。我們可以簡單地傳遞一個 io.Reader 來抽象資料來源,而不是傳遞檔名。
是檔案嗎? HTTP body?位元組緩衝區?這並不重要,因為我們仍將使用相同的 Read 方法。
在我們的例子中,我們甚至可以緩衝輸入以逐行讀取。因此,我們可以使用 bufio.Reader 及其 ReadLine 方法:
我們把讀取檔案的部分放到函式外面
package main
import (
"bufio"
"fmt"
"io"
"os"
"github.com/pkg/errors"
)
func main() {
filename := "a.txt"
file, err := os.Open(filename)
if err != nil {
fmt.Println(err, "unable to open ", filename)
return
}
defer file.Close()
count, err := count(bufio.NewReader(file))
if err != nil {
fmt.Println(err)
return
}
fmt.Println(count)
}
func count(reader *bufio.Reader) (int, error) {
count := 0
for {
line, _, err := reader.ReadLine()
if err != nil {
switch err {
default:
return 0, errors.Wrapf(err, "unable to read")
case io.EOF:
return count, nil
}
}
if len(line) == 0 {
count++
}
}
}
使用第二種實現,無論實際資料來源如何,都可以呼叫該函式。同時,這將有助於我們的單元測試,因為我們可以簡單地從字串建立一個 bufio.Reader:
package main
import (
"bufio"
"fmt"
"io"
"strings"
"github.com/pkg/errors"
)
func main() {
count, err := count(bufio.NewReader(strings.NewReader("input\n\n")))
if err != nil {
fmt.Println(err)
return
}
fmt.Println(count)
}
func count(reader *bufio.Reader) (int, error) {
count := 0
for {
line, _, err := reader.ReadLine()
if err != nil {
switch err {
default:
return 0, errors.Wrapf(err, "unable to read")
case io.EOF:
return count, nil
}
}
if len(line) == 0 {
count++
}
}
}
8、Goroutines 和迴圈變數
我看到一個常見錯誤是使用帶有迴圈變數的 goroutines。
以下示例的輸出是什麼?
package main
import (
"fmt"
"time"
)
func main() {
ints := []int{1, 2, 3}
for _, i := range ints {
go func() {
fmt.Printf("%v\n", i)
}()
}
time.Sleep(time.Second)
}
在這個例子中,每個 goroutine 共享相同的變數例項,所以它會產生 3 3 3。而不是我們認為的1 2 3
有兩種解決方案可以解決這個問題。第一個是將 i 變數的值傳遞給閉包(內部函式):
package main
import (
"fmt"
"time"
)
func main() {
ints := []int{1, 2, 3}
for _, i := range ints {
go func(i int) {
fmt.Printf("%v\n", i)
}(i)
}
time.Sleep(time.Second)
}
第二個是在 for 迴圈範圍內建立另一個變數:
package main
import (
"fmt"
"time"
)
func main() {
ints := []int{1, 2, 3}
for _, i := range ints {
i := i
go func() {
fmt.Printf("%v\n", i)
}()
}
time.Sleep(time.Second)
}
呼叫 i := i 可能看起來有點奇怪,但它完全有效。處於迴圈中意味著處於另一個範圍內。所以 i := i 建立了另一個名為 i 的變數例項。當然,為了便於閱讀,我們可能想用不同的名稱來稱呼它。
原文
itnext.io/the-top-10-most-common-m...
本作品採用《CC 協議》,轉載必須註明作者和本文連結