Halo 開源專案學習(七):快取機制

John同學發表於2022-04-29

基本介紹

我們知道,頻繁運算元據庫會降低伺服器的系統效能,因此通常需要將頻繁訪問、更新的資料存入到快取。Halo 專案也引入了快取機制,且設定了多種實現方式,如自定義快取、Redis、LevelDB 等,下面我們分析一下快取機制的實現過程。

自定義快取

1. 快取的配置

由於資料在快取中以鍵值對的形式存在,且不同型別的快取系統定義的儲存和讀取等操作都大同小異,所以本文僅介紹專案中預設的自定義快取。自定義快取指的是作者自己編寫的快取,以 ConcurrentHashMap 作為容器,資料儲存在伺服器的記憶體中。在介紹自定義快取之前,我們先看一下 Halo 快取的體系圖:

本人使用的 Halo 1.4.13 版本中並未設定 Redis 快取,上圖來自 1.5.2 版本。

可以看到,作者的設計思路是在上層的抽象類和介面中定義通用的操作方法,而具體的快取容器、資料的儲存以及讀取方法則是在各個實現類中定義。如果希望修改快取的型別,只需要在配置類 HaloProperties 中修改 cache 欄位的值:

@Bean
@ConditionalOnMissingBean
AbstractStringCacheStore stringCacheStore() {
    AbstractStringCacheStore stringCacheStore;
    // 根據 cache 欄位的值選擇具體的快取型別
    switch (haloProperties.getCache()) {
        case "level":
            stringCacheStore = new LevelCacheStore(this.haloProperties);
            break;
        case "redis":
            stringCacheStore = new RedisCacheStore(stringRedisTemplate);
            break;
        case "memory":
        default:
            stringCacheStore = new InMemoryCacheStore();
            break;
    }
    log.info("Halo cache store load impl : [{}]", stringCacheStore.getClass());
    return stringCacheStore;
}

上述程式碼來自 1.5.2 版本。

cache 欄位的預設值為 "memory",因此快取的實現類為 InMemoryCacheStore(自定義快取):

public class InMemoryCacheStore extends AbstractStringCacheStore {

    /**
     * Cleaner schedule period. (ms)
     */
    private static final long PERIOD = 60 * 1000;

    /**
     * Cache container.
     */
    public static final ConcurrentHashMap<String, CacheWrapper<String>> CACHE_CONTAINER =
        new ConcurrentHashMap<>();

    private final Timer timer;

    /**
     * Lock.
     */
    private final Lock lock = new ReentrantLock();

    public InMemoryCacheStore() {
        // Run a cache store cleaner
        timer = new Timer();
        // 每 60s 清除一次過期的 key
        timer.scheduleAtFixedRate(new CacheExpiryCleaner(), 0, PERIOD);
    }
    // 省略部分程式碼
}

InMemoryCacheStore 成員變數的含義如下:

  1. CACHE_CONTAINER 是 InMemoryCacheStore 的快取容器,型別為 ConcurrentHashMap。使用 ConcurrentHashMap 是為了保證執行緒安全,因為快取中會存放快取鎖相關的資料(下文中介紹),每當使用者訪問後臺的服務時,就會有新的資料進入快取,這些資料可能來自於不同的執行緒,因此 CACHE_CONTAINER 需要考慮多個執行緒同時操作的情況。
  1. timer 負責執行週期任務,任務的執行頻率為 PERIOD,預設為一分鐘,週期任務的處理邏輯是清除快取中已經過期的 key。

  2. lock 是 ReentrantLock 型別的排它鎖,與快取鎖有關。

2. 快取中的資料

快取中儲存的資料包括:

  1. 系統設定中的選項資訊,其實就是 options 表中儲存的資料。

  2. 已登入使用者(博主)的 token。

  3. 已獲得文章授權的客戶端的 sessionId。

  4. 快取鎖相關的資料。

在之前的文章中,我們介紹過 token 和 sessionId 的儲存和獲取,因此本文就不再贅述這一部分內容了,詳見 Halo 開源專案學習(三):註冊與登入Halo 開源專案學習(四):釋出文章與頁面。快取鎖我們在下一節再介紹,本節中我們先看看 Halo 如何儲存 options 資訊。

首先需要了解一下 options 資訊是什麼時候存入到快取中的,實際上,程式在啟動後會釋出 ApplicationStartedEvent 事件,專案中定義了負責監聽 ApplicationStartedEvent 事件的監聽器 StartedListener(listener 包下),該監聽器在事件釋出後會執行 initThemes 方法,下面是 initThemes 方法中的部分程式碼片段:

private void initThemes() {
    // Whether the blog has initialized
    Boolean isInstalled = optionService
        .getByPropertyOrDefault(PrimaryProperties.IS_INSTALLED, Boolean.class, false);
    // 省略部分程式碼
} 

該方法會呼叫 getByPropertyOrDefault 方法從快取中查詢部落格的安裝狀態,我們從 getByPropertyOrDefault 方法開始,沿著呼叫鏈向下搜尋,可以追蹤到 OptionProvideService 介面中的 getByKey 方法:

default Optional<Object> getByKey(@NonNull String key) {
    Assert.hasText(key, "Option key must not be blank");
    // 如果 val = listOptions().get(key) 不為空, 返回 value 為 val 的 Optional 物件, 否則返回 value 為空的 Optional 物件
    return Optional.ofNullable(listOptions().get(key));
}

可以看到,重點是這個 listOptions 方法,該方法在 OptionServiceImpl 類中定義:

public Map<String, Object> listOptions() {
    // Get options from cache
    // 從快取 CACHE_CONTAINER 中獲取 "options" 這個 key 對應的資料, 並將該資料轉化為 Map 物件
    return cacheStore.getAny(OPTIONS_KEY, Map.class).orElseGet(() -> {
        // 初次呼叫時需要從 options 表中獲取所有的 Option 物件
        List<Option> options = listAll();
        // 所有 Option 物件的 key 集合
        Set<String> keys = ServiceUtils.fetchProperty(options, Option::getKey);

        /*
            * options 表中儲存的記錄其實就是使用者自定義的 Option 選項, 當使用者修改部落格設定時, 會自動更新 options 表,
            * Halo 中對一些選項的 value 設定了確定的型別, 例如 EmailProperties 這個類中的 HOST 為 String 型別, 而
            * SSL_PORT 則為 Integer 型別, 由於 Option 類中 value 一律為 String 型別, 因此需要將某些 value 轉化為指
            * 定的型別
            */
        Map<String, Object> userDefinedOptionMap =
            ServiceUtils.convertToMap(options, Option::getKey, option -> {
                String key = option.getKey();

                PropertyEnum propertyEnum = propertyEnumMap.get(key);

                if (propertyEnum == null) {
                    return option.getValue();
                }
                // 對 value 進行型別轉換
                return PropertyEnum.convertTo(option.getValue(), propertyEnum);
            });

        Map<String, Object> result = new HashMap<>(userDefinedOptionMap);

        // Add default property
        /*
            * 有些選項是 Halo 預設設定的, 例如 EmailProperties 中的 SSL_PORT, 使用者未設定時, 它也會被設定為預設的 465,
            * 同樣, 也需要將預設的 "465" 轉化為 Integer 型別的 465
            */
        propertyEnumMap.keySet()
            .stream()
            .filter(key -> !keys.contains(key))
            .forEach(key -> {
                PropertyEnum propertyEnum = propertyEnumMap.get(key);

                if (StringUtils.isBlank(propertyEnum.defaultValue())) {
                    return;
                }
                // 對 value 進行型別轉換並存入 result
                result.put(key,
                    PropertyEnum.convertTo(propertyEnum.defaultValue(), propertyEnum));
            });

        // Cache the result
        // 將所有的選項加入快取
        cacheStore.putAny(OPTIONS_KEY, result);

        return result;
    });
}

伺服器首先從 CACHE_CONTAINER 中獲取 "options" 這個 key 對應的資料,然後將該資料轉化為 Map 型別的物件。由於初次查詢時 CACHE_CONTAINER 中 並沒有 "options" 對應的 value,因此需要進行初始化:

  1. 首先從 options 表中獲取所有的 Option 物件,並將這些物件存入到 Map 中。其中 key 和 value 均為 Option 物件中的 key 和 value,但 value 還需要進行一個型別轉換,因為在 Option 類中 value 被定義為了 String 型別。例如,"is_installed" 對應的 value 為 "true",為了能夠正常使用 value,需要將字串 "true" 轉化成 Boolean 型別的 true。結合上下文,我們發現程式是根據 PrimaryProperties 類(繼承 PropertyEnum 的列舉類)中定義的列舉物件 IS_INSTALLED("is_installed", Boolean.class, "false") 來確認目標型別 Boolean 的。

  2. options 表中的選項是使用者自定義的選項,除此之外,Halo 中還設定了一些預設的選項,這些選項均在 PropertyEnum 的子類中定義,例如 EmailProperties 類中的 SSL_PORT("email_ssl_port", Integer.class, "465"),其對應的 key 為 "email_ssl_port",value 為 "465"。伺服器也會將這些 key - value 對存入到 Map,並對 value 進行型別轉換。

以上便是 listOptions 方法的處理邏輯,我們回到 getByKey 方法,當獲取到 listOptions 方法返回的 Map 物件後,伺服器可以根據指定的 key(如 "is_installed")獲取到對應的屬性值(如 true)。當使用者在管理員後臺修改部落格的系統設定時,伺服器會根據使用者的配置更新 options 表,併發布 OptionUpdatedEvent 事件,之後負責處理事件的監聽器會將快取中的 "options" 刪除,下次查詢時再根據上述步驟執行初始化操作(詳見 FreemarkerConfigAwareListener 中的 onOptionUpdate 方法)。

3. 快取的過期處理

快取的過期處理是一個非常重要的知識點,資料過期後,通常需要將其從快取中刪除。從上文中的 cacheStore.putAny(OPTIONS_KEY, result) 方法中我們得知,伺服器將資料儲存到快取之前,會先將其封裝成 CacheWrapper 物件:

class CacheWrapper<V> implements Serializable {

    /**
     * Cache data
     */
    private V data;

    /**
     * Expired time.
     */
    private Date expireAt;

    /**
     * Create time.
     */
    private Date createAt;
}

其中 data 是需要儲存的資料,createAt 和 expireAt 分別是資料的建立時間和過期時間。Halo 專案中,"options" 是沒有過期時間的,只有當資料更新時,監聽器才會將舊的資料刪除。需要注意的是,token 和 sessionId 均有過期時間,對於有過期時間的 key,專案中也有相應的處理辦法。以 token 為例,攔截器攔截到使用者的請求後會確認使用者的身份,也就是查詢快取中是否具有 token 對應的使用者 id,這個查詢操作的底層呼叫的是 get 方法(在 AbstractCacheStore 類中定義):

public Optional<V> get(K key) {
    Assert.notNull(key, "Cache key must not be blank");

    return getInternal(key).map(cacheWrapper -> {
        // Check expiration
        // 過期
        if (cacheWrapper.getExpireAt() != null
            && cacheWrapper.getExpireAt().before(run.halo.app.utils.DateUtils.now())) {
            // Expired then delete it
            log.warn("Cache key: [{}] has been expired", key);

            // Delete the key
            delete(key);

            // Return null
            return null;
        }
        // 未過期返回快取資料
        return cacheWrapper.getData();
    });
}

伺服器獲取到 key 對應的 CacheWrapper 物件後,會檢查其中的過期時間,如果資料已過期,那麼直接將其刪除並返回 null。另外,上文中提到,timer(InMemoryCacheStore 的成員變數)的週期任務也負責刪除過期的資料,下面是 timer 週期任務執行的方法:

private class CacheExpiryCleaner extends TimerTask {

    @Override
    public void run() {
        CACHE_CONTAINER.keySet().forEach(key -> {
            if (!InMemoryCacheStore.this.get(key).isPresent()) {
                log.debug("Deleted the cache: [{}] for expiration", key);
            }
        });
    }
}

可見,週期任務也是通過呼叫 get 方法來刪除過期資料的。

快取鎖

Halo 專案中的快取鎖也是一個比較有意思的模組,其作用是限制使用者對某個功能的呼叫頻率,可認為是對請求的方法進行加鎖。快取鎖主要利用自定義註解 @CacheLock 和 AOP 來實現,@CacheLock 註解的定義如下:

@Target(ElementType.METHOD)
@Retention(RetentionPolicy.RUNTIME)
@Documented
@Inherited
public @interface CacheLock {

    @AliasFor("value")
    String prefix() default "";


    @AliasFor("prefix")
    String value() default "";


    long expired() default 5;


    TimeUnit timeUnit() default TimeUnit.SECONDS;


    String delimiter() default ":";


    boolean autoDelete() default true;


    boolean traceRequest() default false;
}

各個成員變數的含義為:

  • prefix:用於構建 cacheLockKey(一個字串)的字首。

  • value:同 prefix。

  • expired:快取鎖的持續時間。

  • timeUnit:持續時間的單位。

  • delimiter:分隔符,構建 cacheLockKey 時使用。

  • autoDelete:是否自動刪除快取鎖。

  • traceRequest:是否追蹤請求的 IP,如果是,那麼構建 cacheLockKey 時會新增使用者的 IP。

快取鎖的使用方法是在需要加鎖的方法上新增 @CacheLock 註解,然後通過 Spring 的 AOP 在方法執行前對方法進行加鎖,方法執行結束後再將鎖取消。專案中的切面類為 CacheLockInterceptor,負責加/解鎖的邏輯如下:

Around("@annotation(run.halo.app.cache.lock.CacheLock)")
public Object interceptCacheLock(ProceedingJoinPoint joinPoint) throws Throwable {
    // 獲取方法簽名
    // Get method signature
    MethodSignature methodSignature = (MethodSignature) joinPoint.getSignature();

    log.debug("Starting locking: [{}]", methodSignature.toString());

    // 獲取方法上的 CacheLock 註解
    // Get cache lock
    CacheLock cacheLock = methodSignature.getMethod().getAnnotation(CacheLock.class);
    // 構造快取鎖的 key
    // Build cache lock key
    String cacheLockKey = buildCacheLockKey(cacheLock, joinPoint);
    System.out.println(cacheLockKey);
    log.debug("Built lock key: [{}]", cacheLockKey);

    try {
        // Get from cache
        Boolean cacheResult = cacheStore
            .putIfAbsent(cacheLockKey, CACHE_LOCK_VALUE, cacheLock.expired(),
                cacheLock.timeUnit());

        if (cacheResult == null) {
            throw new ServiceException("Unknown reason of cache " + cacheLockKey)
                .setErrorData(cacheLockKey);
        }

        if (!cacheResult) {
            throw new FrequentAccessException("訪問過於頻繁,請稍後再試!").setErrorData(cacheLockKey);
        }
        // 執行註解修飾的方法
        // Proceed the method
        return joinPoint.proceed();
    } finally {
        // 方法執行結束後, 是否自動刪除快取鎖
        // Delete the cache
        if (cacheLock.autoDelete()) {
            cacheStore.delete(cacheLockKey);
            log.debug("Deleted the cache lock: [{}]", cacheLock);
        }
    }
}

@Around("@annotation(run.halo.app.cache.lock.CacheLock)") 表示,如果請求的方法被 @CacheLock 註解修飾,那麼伺服器不會執行該方法,而是執行 interceptCacheLock 方法:

  1. 獲取方法上的 CacheLock 註解並構建 cacheLockKey。

  2. 檢視快取中是否存在 cacheLockKey,如果存在,那麼丟擲異常,提醒使用者訪問過於頻繁。如果不存在,那麼將 cacheLockKey 存入到快取(有效時間為 expired),並執行請求的方法。

  3. 如果 CacheLock 註解中的 autoDelete 為 true,那麼方法執行結束後立即刪除 cacheLockKey。

快取鎖的原理和 Redis 的 setnx + expire 相似,如果 key 已存在,就不能再次新增。下面是構建 cacheLockKey 的邏輯:

private String buildCacheLockKey(@NonNull CacheLock cacheLock,
    @NonNull ProceedingJoinPoint joinPoint) {
    Assert.notNull(cacheLock, "Cache lock must not be null");
    Assert.notNull(joinPoint, "Proceeding join point must not be null");

    // Get the method
    MethodSignature methodSignature = (MethodSignature) joinPoint.getSignature();

    // key 的字首
    // Build the cache lock key
    StringBuilder cacheKeyBuilder = new StringBuilder(CACHE_LOCK_PREFIX);
    // 分隔符
    String delimiter = cacheLock.delimiter();
    // 如果 CacheLock 中設定了字首, 那麼直接使用該字首, 否則使用方法名
    if (StringUtils.isNotBlank(cacheLock.prefix())) {
        cacheKeyBuilder.append(cacheLock.prefix());
    } else {
        cacheKeyBuilder.append(methodSignature.getMethod().toString());
    }
    // 提取被 CacheParam 註解修飾的變數的值
    // Handle cache lock key building
    Annotation[][] parameterAnnotations = methodSignature.getMethod().getParameterAnnotations();

    for (int i = 0; i < parameterAnnotations.length; i++) {
        log.debug("Parameter annotation[{}] = {}", i, parameterAnnotations[i]);

        for (int j = 0; j < parameterAnnotations[i].length; j++) {
            Annotation annotation = parameterAnnotations[i][j];
            log.debug("Parameter annotation[{}][{}]: {}", i, j, annotation);
            if (annotation instanceof CacheParam) {
                // Get current argument
                Object arg = joinPoint.getArgs()[i];
                log.debug("Cache param args: [{}]", arg);

                // Append to the cache key
                cacheKeyBuilder.append(delimiter).append(arg.toString());
            }
        }
    }
    // 是否新增請求的 IP
    if (cacheLock.traceRequest()) {
        // Append http request info
        cacheKeyBuilder.append(delimiter).append(ServletUtils.getRequestIp());
    }
    return cacheKeyBuilder.toString();
}

可以發現,cacheLockKey 的結構為 cache_lock_ + CacheLock 註解中設定的字首或方法簽名 + 分隔符 + CacheParam 註解修飾的引數的值 + 分隔符 + 請求的 IP,例如:

cache_lock_public void run.halo.app.controller.content.api.PostController.like(java.lang.Integer):1:127.0.0.1

CacheParam 同 CacheLock 一樣,都是為實現快取鎖而定義的註解。CacheParam 的作用是將鎖的粒度精確到具體的實體,如點贊請求:

@PostMapping("{postId:\\d+}/likes")
@ApiOperation("Likes a post")
@CacheLock(autoDelete = false, traceRequest = true)
public void like(@PathVariable("postId") @CacheParam Integer postId) {
    postService.increaseLike(postId);
}

引數 postId 被 CacheParam 修飾,根據 buildCacheLockKey 方法的邏輯,postId 也將是 cacheLockKey 的一部分,這樣鎖定的就是 "為 id 等於 postId 的文章點贊" 這一方法,而非鎖定 "點贊" 方法。

此外,CacheLock 註解中的 traceRequest 引數也很重要,如果 traceRequest 為 true,那麼請求的 IP 會被新增到 cacheLockKey 中,此時快取鎖僅限制同一 IP 對某個方法的請求頻率,不同 IP 之間互不干擾。如果 traceRequest 為 false,那麼快取鎖就是一個分散式鎖,不同 IP 不能同時訪問同一個功能,例如當某個使用者為某篇文章點贊後,短時間內其它使用者不能為該文章點贊。

最後我們再分析一下 putIfAbsent 方法(在 interceptCacheLock 中被呼叫),其功能和 Redis 的 setnx 相似,該方法的具體處理邏輯可追蹤到 InMemoryCacheStore 類中的 putInternalIfAbsent 方法:

Boolean putInternalIfAbsent(@NonNull String key, @NonNull CacheWrapper<String> cacheWrapper) {
    Assert.hasText(key, "Cache key must not be blank");
    Assert.notNull(cacheWrapper, "Cache wrapper must not be null");

    log.debug("Preparing to put key: [{}], value: [{}]", key, cacheWrapper);
    // 加鎖
    lock.lock();
    try {
        // 獲取 key 對應的 value
        // Get the value before
        Optional<String> valueOptional = get(key);
        // value 不為空返回 false
        if (valueOptional.isPresent()) {
            log.warn("Failed to put the cache, because the key: [{}] has been present already",
                key);
            return false;
        }
        // 在快取中新增 value 並返回 true
        // Put the cache wrapper
        putInternal(key, cacheWrapper);
        log.debug("Put successfully");
        return true;
    } finally {
        // 解鎖
        lock.unlock();
    }
}

上節中我們提到,自定義快取 InMemoryCacheStore 中有一個 ReentrantLock 型別的成員變數 lock,lock 的作用就是保證 putInternalIfAbsent 方法的執行緒安全性,因為向快取容器中新增 cacheLockKey 是多個執行緒並行執行的。如果不新增 lock,那麼當多個執行緒同時操作同一個 cacheLockKey 時,不同執行緒可能都會檢測到快取中沒有 cacheLockKey,因此 putInternalIfAbsent 方法均返回 true,之後多個執行緒就可以同時執行某個方法,新增 lock 後就能夠避免這種情況。

結語

關於 Halo 專案快取機制就介紹到這裡了,如有理解錯誤,歡迎大家批評指正 ( ̳• ◡ • ̳)。

相關文章