Guava 原始碼分析（Cache 原理）

crossoverJie發表於2019-01-19

原文網址 : https://flycode.co/archives/72830

Guava原始碼

前言

Google 出的 Guava 是 Java 核心增強的庫，應用非常廣泛。

我平時用的也挺頻繁，這次就藉助日常使用的 Cache 元件來看看 Google 大牛們是如何設計的。

快取

本次主要討論快取。

快取在日常開發中舉足輕重，如果你的應用對某類資料有著較高的讀取頻次，並且改動較小時那就非常適合利用快取來提高效能。

快取之所以可以提高效能是因為它的讀取效率很高，就像是 CPU 的 L1、L2、L3 快取一樣，級別越高相應的讀取速度也會越快。

但也不是什麼好處都佔，讀取速度快了但是它的記憶體更小資源更寶貴，所以我們應當快取真正需要的資料。

其實也就是典型的空間換時間。

下面談談 Java 中所用到的快取。

JVM 快取

首先是 JVM 快取，也可以認為是堆快取。

其實就是建立一些全域性變數，如 Map、List 之類的容器用於存放資料。

這樣的優勢是使用簡單但是也有以下問題：

只能顯式的寫入，清除資料。
不能按照一定的規則淘汰資料，如 LRU，LFU，FIFO 等。
清除資料時的回撥通知。
其他一些定製功能等。

Ehcache、Guava Cache

所以出現了一些專門用作 JVM 快取的開源工具出現了，如本文提到的 Guava Cache。

它具有上文 JVM 快取不具有的功能，如自動清除資料、多種清除演算法、清除回撥等。

但也正因為有了這些功能，這樣的快取必然會多出許多東西需要額外維護，自然也就增加了系統的消耗。

分散式快取

剛才提到的兩種快取其實都是堆內快取，只能在單個節點中使用，這樣在分散式場景下就招架不住了。

於是也有了一些快取中介軟體，如 Redis、Memcached，在分散式環境下可以共享記憶體。

具體不在本次的討論範圍。

Guava Cache 示例

之所以想到 Guava 的 Cache，也是最近在做一個需求，大體如下：

從 Kafka 實時讀取出應用系統的日誌資訊，該日誌資訊包含了應用的健康狀況。如果在時間視窗 N 內發生了 X 次異常資訊，相應的我就需要作出反饋（報警、記錄日誌等）。

對此 Guava 的 Cache 就非常適合，我利用了它的 N 個時間內不寫入資料時快取就清空的特點，在每次讀取資料時判斷異常資訊是否大於 X 即可。

虛擬碼如下：


    @Value("${alert.in.time:2}")
    private int time ;

    @Bean
    public LoadingCache buildCache(){
        return CacheBuilder.newBuilder()
                .expireAfterWrite(time, TimeUnit.MINUTES)
                .build(new CacheLoader<Long, AtomicLong>() {
                    @Override
                    public AtomicLong load(Long key) throws Exception {
                        return new AtomicLong(0);
                    }
                });
    }
    
    
    /**
     * 判斷是否需要報警
     */
    public void checkAlert() {
        try {
            if (counter.get(KEY).incrementAndGet() >= limit) {
                LOGGER.info("***********報警***********");

                //將快取清空
                counter.get(KEY).getAndSet(0L);
            }
        } catch (ExecutionException e) {
            LOGGER.error("Exception", e);
        }
    }   
複製程式碼