快取設計的好，服務基本不會倒

kevwan發表於2021-02-05

原文網址 : https://learnku.com/articles/54256

本文由『Go開源說』第四期 go-zero 直播內容修改整理而成，視訊內容較長，拆分成上下篇，本文內容有所刪減和重構。

大家好，很高興來到“GO開源說” 跟大家分享開源專案背後的一些故事、設計思想以及使用方法，今天分享的專案是 go-zero，一個整合了各種工程實踐的 web 和 rpc 框架。我是Kevin，go-zero 作者，我的 github id 是 kevwan。

go-zero 概覽

go-zero 雖然是20年8月7號才開源，但是已經經過線上大規模檢驗了，也是我近20年工程經驗的積累，開源後得到社群的積極反饋，在5個多月的時間裡，獲得了6k stars。多次登頂github Go語言日榜、周榜、月榜榜首，並獲得了gitee最有價值專案（GVP），開源中國年度最佳人氣專案。同時微信社群極為活躍，3000+人的社群群，go-zero愛好者們一起交流go-zero使用心得和討論使用過程中的問題。

star

go-zero 如何自動管理快取？

快取設計原理

我們對快取是隻刪除，不做更新，一旦DB裡資料出現修改，我們就會直接刪除對應的快取，而不是去更新。

我們看看刪除快取的順序怎樣才是正確的。

先刪除快取，再更新DB

我們看兩個併發請求的情況，A請求需要更新資料，先刪除了快取，然後B請求來讀取資料，此時快取沒有資料，就會從DB載入資料並寫回快取，然後A更新了DB，那麼此時快取內的資料就會一直是髒資料，知道快取過期或者有新的更新資料的請求。如圖

先更新DB，再刪除快取

A請求先更新DB，然後B請求來讀取資料，此時返回的是老資料，此時可以認為是A請求還沒更新完，最終一致性，可以接受，然後A刪除了快取，後續請求都會拿到最新資料，如圖

讓我們再來看一下正常的請求流程：

第一個請求更新DB，並刪除了快取
第二個請求讀取快取，沒有資料，就從DB讀取資料，並回寫到快取裡
後續讀請求都可以直接從快取讀取

我們再看一下DB查詢有哪些情況，假設行記錄裡有ABCDEFG七列資料：

只查詢部分列資料的請求，比如請求其中的ABC，CDE或者EFG等，如圖

查詢單條完整行記錄，如圖

查詢多條行記錄的部分或全部列，如圖

對於上面三種情況，首先，我們不用部分查詢，因為部分查詢沒法快取，一旦快取了，資料有更新，沒法定位到有哪些資料需要刪除；其次，對於多行的查詢，根據實際場景和需要，我們會在業務層建立對應的從查詢條件到主鍵的對映；而對於單行完整記錄的查詢，go-zero 內建了完整的快取管理方式。所以核心原則是：go-zero 快取的一定是完整的行記錄。

下面我們來詳細介紹 go-zero 內建的三種場景的快取處理方式：

基於主鍵的快取
```
PRIMARY KEY (`id`)
```
這種相對來講是最容易處理的快取，只需要在 redis 裡用 primary key 作為 key 來快取行記錄即可。
基於唯一索引的快取

在做基於索引的快取設計的時候我借鑑了 database 索引的設計方法，在 database 設計裡，如果通過索引去查資料時，引擎會先在 索引->主鍵 的 tree 裡面查詢到主鍵，然後再通過主鍵去查詢行記錄，就是引入了一個間接層去解決索引到行記錄的對應問題。在 go-zero 的快取設計裡也是同樣的原理。

基於索引的快取又分為單列唯一索引和多列唯一索引：
- 單列唯一索引如下：
```
UNIQUE KEY `product_idx` (`product`)
```
- 多列唯一索引如下：
```
UNIQUE KEY `vendor_product_idx` (`vendor`, `product`)
```
但是對於 go-zero 來說，單列和多列只是生成快取 key 的方式不同而已，背後的控制邏輯是一樣的。然後 go-zero 內建的快取管理就比較好的控制了資料一致性問題，同時也內建防止了快取的擊穿、穿透、雪崩問題（這些在 gopherchina 大會上分享的時候仔細講過，見後續 gopherchina 分享視訊）。

另外，go-zero 內建了快取訪問量、訪問命中率統計，如下所示：
```
dbcache(sqlc) - qpm: 5057, hit_ratio: 99.7%, hit: 5044, miss: 13, db_fails: 0
```
可以看到比較詳細的統計資訊，便於我們來分析快取的使用情況，對於快取命中率極低或者請求量極小的情況，我們就可以去掉快取了，這樣也可以降低成本。

快取程式碼解讀

1. 基於主鍵的快取邏輯

具體實現程式碼如下：

func (cc CachedConn) QueryRow(v interface{}, key string, query QueryFn) error {
  return cc.cache.Take(v, key, func(v interface{}) error {
    return query(cc.db, v)
  })
}

這裡的 Take 方法是先從快取裡去通過 key 拿資料，如果拿到就直接返回，如果拿不到，那麼就通過 query 方法去 DB 讀取完整行記錄並寫回快取，然後再返回資料。整個邏輯還是比較簡單易懂的。

我們詳細看看 Take 的實現：

func (c cacheNode) Take(v interface{}, key string, query func(v interface{}) error) error {
  return c.doTake(v, key, query, func(v interface{}) error {
    return c.SetCache(key, v)
  })
}

Take 的邏輯如下：

用 key 從快取裡查詢資料
如果找到，則返回資料
如果找不到，用 query 方法去讀取資料
讀到後呼叫 c.SetCache(key, v) 設定快取

其中的 doTake 程式碼和解釋如下：

// v - 需要讀取的資料物件
// key - 快取key
// query - 用來從DB讀取完整資料的方法
// cacheVal - 用來寫快取的方法
func (c cacheNode) doTake(v interface{}, key string, query func(v interface{}) error,
  cacheVal func(v interface{}) error) error {
  // 用barrier來防止快取擊穿，確保一個程式內只有一個請求去載入key對應的資料
  val, fresh, err := c.barrier.DoEx(key, func() (interface{}, error) {
    // 從cache裡讀取資料
    if err := c.doGetCache(key, v); err != nil {
      // 如果是預先放進來的placeholder（用來防止快取穿透）的，那麼就返回預設的errNotFound
      // 如果是未知錯誤，那麼就直接返回，因為我們不能放棄快取出錯而直接把所有請求去請求DB，
      // 這樣在高併發的場景下會把DB打掛掉的
      if err == errPlaceholder {
        return nil, c.errNotFound
      } else if err != c.errNotFound {
        // why we just return the error instead of query from db,
        // because we don't allow the disaster pass to the DBs.
        // fail fast, in case we bring down the dbs.
        return nil, err
      }

      // 請求DB
      // 如果返回的error是errNotFound，那麼我們就需要在快取裡設定placeholder，防止快取穿透
      if err = query(v); err == c.errNotFound {
        if err = c.setCacheWithNotFound(key); err != nil {
          logx.Error(err)
        }

        return nil, c.errNotFound
      } else if err != nil {
        // 統計DB失敗
        c.stat.IncrementDbFails()
        return nil, err
      }

      // 把資料寫入快取
      if err = cacheVal(v); err != nil {
        logx.Error(err)
      }
    }
    
    // 返回json序列化的資料
    return jsonx.Marshal(v)
  })
  if err != nil {
    return err
  }
  if fresh {
    return nil
  }

  // got the result from previous ongoing query
  c.stat.IncrementTotal()
  c.stat.IncrementHit()

  // 把資料寫入到傳入的v物件裡
  return jsonx.Unmarshal(val.([]byte), v)
}

2. 基於唯一索引的快取邏輯

因為這塊比較複雜，所以我用不同顏色標識出來了響應的程式碼塊和邏輯，block 2 其實跟基於主鍵的快取是一樣的，這裡主要講 block 1 的邏輯。

程式碼塊的 block 1 部分分為兩種情況：

通過索引能夠從快取裡找到主鍵

此時就直接用主鍵走 block 2 的邏輯了，後續同上面基於主鍵的快取邏輯
通過索引無法從快取裡找到主鍵
- 通過索引從DB裡查詢完整行記錄，如有 error，返回
- 查到完整行記錄後，會把主鍵到完整行記錄的快取和索引到主鍵的快取同時寫到 redis 裡
- 返回所需的行記錄資料

// v - 需要讀取的資料物件
// key - 通過索引生成的快取key
// keyer - 用主鍵生成基於主鍵快取的key的方法
// indexQuery - 用索引從DB讀取完整資料的方法，需要返回主鍵
// primaryQuery - 用主鍵從DB獲取完整資料的方法
func (cc CachedConn) QueryRowIndex(v interface{}, key string, keyer func(primary interface{}) string,
  indexQuery IndexQueryFn, primaryQuery PrimaryQueryFn) error {
  var primaryKey interface{}
  var found bool

  // 先通過索引查詢快取，看是否有索引到主鍵的快取
  if err := cc.cache.TakeWithExpire(&primaryKey, key, func(val interface{}, expire time.Duration) (err error) {
    // 如果沒有索引到主鍵的快取，那麼就通過索引查詢完整資料
    primaryKey, err = indexQuery(cc.db, v)
    if err != nil {
      return
    }

    // 通過索引查詢到了完整資料，設定found，後面直接使用，不需要再從快取讀取資料了
    found = true
    // 將主鍵到完整資料的對映儲存到快取裡，TakeWithExpire方法已經將索引到主鍵的對映儲存到快取了
    return cc.cache.SetCacheWithExpire(keyer(primaryKey), v, expire+cacheSafeGapBetweenIndexAndPrimary)
  }); err != nil {
    return err
  }

  // 已經通過索引找到了資料，直接返回即可
  if found {
    return nil
  }

  // 通過主鍵從快取讀取資料，如果快取沒有，通過primaryQuery方法從DB讀取並回寫快取再返回資料
  return cc.cache.Take(v, keyer(primaryKey), func(v interface{}) error {
    return primaryQuery(cc.db, v, primaryKey)
  })
}

我們來看一個實際的例子

func (m *defaultUserModel) FindOneByUser(user string) (*User, error) {
  var resp User
  // 生成基於索引的key
  indexKey := fmt.Sprintf("%s%v", cacheUserPrefix, user)
  
  err := m.QueryRowIndex(&resp, indexKey,
    // 基於主鍵生成完整資料快取的key
    func(primary interface{}) string {
      return fmt.Sprintf("user#%v", primary)
    },
    // 基於索引的DB查詢方法
    func(conn sqlx.SqlConn, v interface{}) (i interface{}, e error) {
      query := fmt.Sprintf("select %s from %s where user = ? limit 1", userRows, m.table)
      if err := conn.QueryRow(&resp, query, user); err != nil {
        return nil, err
      }
      return resp.Id, nil
    },
    // 基於主鍵的DB查詢方法
    func(conn sqlx.SqlConn, v, primary interface{}) error {
      query := fmt.Sprintf("select %s from %s where id = ?", userRows, m.table)
      return conn.QueryRow(&resp, query, primary)
    })
  
  // 錯誤處理，需要判斷是否返回的是sqlc.ErrNotFound，如果是，我們用本package定義的ErrNotFound返回
  // 避免使用者感知到有沒有使用快取，同時也是對底層依賴的隔離
  switch err {
    case nil:
      return &resp, nil
    case sqlc.ErrNotFound:
      return nil, ErrNotFound
    default:
      return nil, err
  }
}

所有上面這些快取的自動管理程式碼都是可以通過 goctl 自動生成的，我們團隊內部 CRUD 和快取基本都是通過 goctl 自動生成的，可以節省大量開發時間，並且快取程式碼本身也是非常容易出錯的，即使有很好的程式碼經驗，也很難每次完全寫對，所以我們推薦儘可能使用自動的快取程式碼生成工具去避免錯誤。

Need more?

如果你想要更好的瞭解 go-zero 專案，歡迎前往官方網站上學習具體的示例。

視訊回放地址

https://www.bilibili.com/video/BV1Jy4y127Xu

專案地址

https://github.com/tal-tech/go-zero

歡迎使用 go-zero 並 star 支援我們！

go-zero 系列文章見『微服務實踐』公眾號

系統架構設計：程式快取和快取服務，如何抉擇？
2020-11-03
架構快取
快取架構中的服務詳解！SpringBoot中二級快取服務的實現
2021-05-22
快取架構Spring Boot
好程式設計師Java培訓分享本地快取如何設計
2020-07-20
程式設計師Java快取
小說軟體原始碼的快取設計，保證服務的正常執行
2021-12-10
原始碼快取
[記]SAF 中快取服務的實現
2021-09-09
快取
倒數計時快取時間問題總結
2019-01-10
快取
Vue 全站快取二：如何設計全站快取
2018-08-01
Vue快取
程式設計中快取的使用
2019-02-28
程式設計快取
固定容量的本地快取設計
2018-12-22
快取
懂得取捨才是快取設計的真諦
2021-05-24
快取
如何設計快取系統：快取穿透，快取擊穿，快取雪崩解決方案分析
2022-12-08
快取穿透
Web應用的快取設計模式
2019-05-11
Web快取設計模式
WSL 安裝 garnet 作為快取服務
2024-07-09
快取
光華設計基金會：2020中國服務設計報告
2020-10-12
好程式設計師Java培訓分享Redis快取使用場景概述
2020-07-08
程式設計師JavaRedis快取
《SpringCloud設計思想》1-雲服務的基礎元件
2020-09-23
SpringGCCloud元件
如何用GO語言編寫快取服務？
2018-12-03
Go快取
Vue SSR服務端渲染之資料快取
2018-07-20
Vue服務端快取
聊聊android列表檢視的快取設計
2019-01-20
Android快取
如何優雅的設計和使用快取？
2018-08-28
快取
解析分散式系統的快取設計
2022-04-12
分散式快取
如何寫好倒數計時
2021-11-17
預防快取穿透方案設計
2018-10-09
快取穿透
快取穿透防護方案設計
2024-11-06
快取穿透
架構設計（三）：引入快取
2022-12-15
架構快取
開箱即用的資料快取服務｜EMQX Cloud 影子服務應用場景解析
2022-10-20
快取MQCloud
一個內建於專案的分散式快取服務
2021-09-16
分散式快取
好程式設計師Python培訓Python如何呼叫服務介面
2020-11-06
程式設計師Python
小工匠聊架構 - 分散式快取技術_快取設計
2020-12-17
架構分散式快取
基於雲服務的個人網站架構設計
2020-06-23
網站架構
EMQX Cloud 影子服務：便捷資料快取服務，加速 IoT 應用開發
2022-09-29
MQCloud快取
【Azure Redis 快取】Azure Redis 服務不支援指令CONFIG
2020-12-16
Redis快取
億級系統的Redis快取如何設計？？？
2023-03-01
Redis快取
訂單服務的設計思考
2018-12-22
[譯] Medium 的 GraphQL 服務設計
2018-11-30
字典服務的設計與管理
2022-08-22
快取內功心法：快取基礎整理
2019-08-30
快取
淺談快取寫法（三）：記憶體快取該如何設計
2019-04-27
快取記憶體