Halo 開源項目學習(七):緩存機制

基本介紹

我們知道,頻繁操作數據庫會降低服務器的系統性能,因此通常需要將頻繁訪問、更新的數據存入到緩存。Halo 項目也引入了緩存機制,且設置了多種實現方式,如自定義緩存、Redis、LevelDB 等,下面我們分析一下緩存機制的實現過程。

自定義緩存

1. 緩存的配置

由於數據在緩存中以鍵值對的形式存在,且不同類型的緩存系統定義的存儲和讀取等操作都大同小異,所以本文僅介紹項目中默認的自定義緩存。自定義緩存指的是作者自己編寫的緩存,以 ConcurrentHashMap 作為容器,數據存儲在服務器的內存中。在介紹自定義緩存之前,我們先看一下 Halo 緩存的體系圖:

本人使用的 Halo 1.4.13 版本中並未設置 Redis 緩存,上圖來自 1.5.2 版本。

可以看到,作者的設計思路是在上層的抽象類和接口中定義通用的操作方法,而具體的緩存容器、數據的存儲以及讀取方法則是在各個實現類中定義。如果希望修改緩存的類型,只需要在配置類 HaloProperties 中修改 cache 字段的值:

@Bean
@ConditionalOnMissingBean
AbstractStringCacheStore stringCacheStore() {
    AbstractStringCacheStore stringCacheStore;
    // 根據 cache 字段的值選擇具體的緩存類型
    switch (haloProperties.getCache()) {
        case "level":
            stringCacheStore = new LevelCacheStore(this.haloProperties);
            break;
        case "redis":
            stringCacheStore = new RedisCacheStore(stringRedisTemplate);
            break;
        case "memory":
        default:
            stringCacheStore = new InMemoryCacheStore();
            break;
    }
    log.info("Halo cache store load impl : [{}]", stringCacheStore.getClass());
    return stringCacheStore;
}

上述代碼來自 1.5.2 版本。

cache 字段的默認值為 “memory”,因此緩存的實現類為 InMemoryCacheStore(自定義緩存):

public class InMemoryCacheStore extends AbstractStringCacheStore {

    /**
     * Cleaner schedule period. (ms)
     */
    private static final long PERIOD = 60 * 1000;

    /**
     * Cache container.
     */
    public static final ConcurrentHashMap<String, CacheWrapper<String>> CACHE_CONTAINER =
        new ConcurrentHashMap<>();

    private final Timer timer;

    /**
     * Lock.
     */
    private final Lock lock = new ReentrantLock();

    public InMemoryCacheStore() {
        // Run a cache store cleaner
        timer = new Timer();
        // 每 60s 清除一次過期的 key
        timer.scheduleAtFixedRate(new CacheExpiryCleaner(), 0, PERIOD);
    }
    // 省略部分代碼
}

InMemoryCacheStore 成員變量的含義如下:

  1. CACHE_CONTAINER 是 InMemoryCacheStore 的緩存容器,類型為 ConcurrentHashMap。使用 ConcurrentHashMap 是為了保證線程安全,因為緩存中會存放緩存鎖相關的數據(下文中介紹),每當用戶訪問後台的服務時,就會有新的數據進入緩存,這些數據可能來自於不同的線程,因此 CACHE_CONTAINER 需要考慮多個線程同時操作的情況。
  1. timer 負責執行周期任務,任務的執行頻率為 PERIOD,默認為一分鐘,周期任務的處理邏輯是清除緩存中已經過期的 key。

  2. lock 是 ReentrantLock 類型的排它鎖,與緩存鎖有關。

2. 緩存中的數據

緩存中存儲的數據包括:

  1. 系統設置中的選項信息,其實就是 options 表中存儲的數據。

  2. 已登錄用戶(博主)的 token。

  3. 已獲得文章授權的客戶端的 sessionId。

  4. 緩存鎖相關的數據。

在之前的文章中,我們介紹過 token 和 sessionId 的存儲和獲取,因此本文就不再贅述這一部分內容了,詳見 Halo 開源項目學習(三):註冊與登錄Halo 開源項目學習(四):發佈文章與頁面。緩存鎖我們在下一節再介紹,本節中我們先看看 Halo 如何保存 options 信息。

首先需要了解一下 options 信息是什麼時候存入到緩存中的,實際上,程序在啟動後會發佈 ApplicationStartedEvent 事件,項目中定義了負責監聽 ApplicationStartedEvent 事件的監聽器 StartedListener(listener 包下),該監聽器在事件發佈後會執行 initThemes 方法,下面是 initThemes 方法中的部分代碼片段:

private void initThemes() {
    // Whether the blog has initialized
    Boolean isInstalled = optionService
        .getByPropertyOrDefault(PrimaryProperties.IS_INSTALLED, Boolean.class, false);
    // 省略部分代碼
} 

該方法會調用 getByPropertyOrDefault 方法從緩存中查詢博客的安裝狀態,我們從 getByPropertyOrDefault 方法開始,沿着調用鏈向下搜索,可以追蹤到 OptionProvideService 接口中的 getByKey 方法:

default Optional<Object> getByKey(@NonNull String key) {
    Assert.hasText(key, "Option key must not be blank");
    // 如果 val = listOptions().get(key) 不為空, 返回 value 為 val 的 Optional 對象, 否則返回 value 為空的 Optional 對象
    return Optional.ofNullable(listOptions().get(key));
}

可以看到,重點是這個 listOptions 方法,該方法在 OptionServiceImpl 類中定義:

public Map<String, Object> listOptions() {
    // Get options from cache
    // 從緩存 CACHE_CONTAINER 中獲取 "options" 這個 key 對應的數據, 並將該數據轉化為 Map 對象
    return cacheStore.getAny(OPTIONS_KEY, Map.class).orElseGet(() -> {
        // 初次調用時需要從 options 表中獲取所有的 Option 對象
        List<Option> options = listAll();
        // 所有 Option 對象的 key 集合
        Set<String> keys = ServiceUtils.fetchProperty(options, Option::getKey);

        /*
            * options 表中存儲的記錄其實就是用戶自定義的 Option 選項, 當用戶修改博客設置時, 會自動更新 options 表,
            * Halo 中對一些選項的 value 設置了確定的類型, 例如 EmailProperties 這個類中的 HOST 為 String 類型, 而
            * SSL_PORT 則為 Integer 類型, 由於 Option 類中 value 一律為 String 類型, 因此需要將某些 value 轉化為指
            * 定的類型
            */
        Map<String, Object> userDefinedOptionMap =
            ServiceUtils.convertToMap(options, Option::getKey, option -> {
                String key = option.getKey();

                PropertyEnum propertyEnum = propertyEnumMap.get(key);

                if (propertyEnum == null) {
                    return option.getValue();
                }
                // 對 value 進行類型轉換
                return PropertyEnum.convertTo(option.getValue(), propertyEnum);
            });

        Map<String, Object> result = new HashMap<>(userDefinedOptionMap);

        // Add default property
        /*
            * 有些選項是 Halo 默認設定的, 例如 EmailProperties 中的 SSL_PORT, 用戶未設置時, 它也會被設定為默認的 465,
            * 同樣, 也需要將默認的 "465" 轉化為 Integer 類型的 465
            */
        propertyEnumMap.keySet()
            .stream()
            .filter(key -> !keys.contains(key))
            .forEach(key -> {
                PropertyEnum propertyEnum = propertyEnumMap.get(key);

                if (StringUtils.isBlank(propertyEnum.defaultValue())) {
                    return;
                }
                // 對 value 進行類型轉換並存入 result
                result.put(key,
                    PropertyEnum.convertTo(propertyEnum.defaultValue(), propertyEnum));
            });

        // Cache the result
        // 將所有的選項加入緩存
        cacheStore.putAny(OPTIONS_KEY, result);

        return result;
    });
}

服務器首先從 CACHE_CONTAINER 中獲取 “options” 這個 key 對應的數據,然後將該數據轉化為 Map 類型的對象。由於初次查詢時 CACHE_CONTAINER 中 並沒有 “options” 對應的 value,因此需要進行初始化:

  1. 首先從 options 表中獲取所有的 Option 對象,並將這些對象存入到 Map 中。其中 key 和 value 均為 Option 對象中的 key 和 value,但 value 還需要進行一個類型轉換,因為在 Option 類中 value 被定義為了 String 類型。例如,”is_installed” 對應的 value 為 “true”,為了能夠正常使用 value,需要將字符串 “true” 轉化成 Boolean 類型的 true。結合上下文,我們發現程序是根據 PrimaryProperties 類(繼承 PropertyEnum 的枚舉類)中定義的枚舉對象 IS_INSTALLED("is_installed", Boolean.class, "false") 來確認目標類型 Boolean 的。

  2. options 表中的選項是用戶自定義的選項,除此之外,Halo 中還設置了一些默認的選項,這些選項均在 PropertyEnum 的子類中定義,例如 EmailProperties 類中的 SSL_PORT("email_ssl_port", Integer.class, "465"),其對應的 key 為 “email_ssl_port”,value 為 “465”。服務器也會將這些 key – value 對存入到 Map,並對 value 進行類型轉換。

以上便是 listOptions 方法的處理邏輯,我們回到 getByKey 方法,當獲取到 listOptions 方法返回的 Map 對象後,服務器可以根據指定的 key(如 “is_installed”)獲取到對應的屬性值(如 true)。當用戶在管理員後台修改博客的系統設置時,服務器會根據用戶的配置更新 options 表,並發佈 OptionUpdatedEvent 事件,之後負責處理事件的監聽器會將緩存中的 “options” 刪除,下次查詢時再根據上述步驟執行初始化操作(詳見 FreemarkerConfigAwareListener 中的 onOptionUpdate 方法)。

3. 緩存的過期處理

緩存的過期處理是一個非常重要的知識點,數據過期後,通常需要將其從緩存中刪除。從上文中的 cacheStore.putAny(OPTIONS_KEY, result) 方法中我們得知,服務器將數據存儲到緩存之前,會先將其封裝成 CacheWrapper 對象:

class CacheWrapper<V> implements Serializable {

    /**
     * Cache data
     */
    private V data;

    /**
     * Expired time.
     */
    private Date expireAt;

    /**
     * Create time.
     */
    private Date createAt;
}

其中 data 是需要存儲的數據,createAt 和 expireAt 分別是數據的創建時間和過期時間。Halo 項目中,”options” 是沒有過期時間的,只有當數據更新時,監聽器才會將舊的數據刪除。需要注意的是,token 和 sessionId 均有過期時間,對於有過期時間的 key,項目中也有相應的處理辦法。以 token 為例,攔截器攔截到用戶的請求後會確認用戶的身份,也就是查詢緩存中是否具有 token 對應的用戶 id,這個查詢操作的底層調用的是 get 方法(在 AbstractCacheStore 類中定義):

public Optional<V> get(K key) {
    Assert.notNull(key, "Cache key must not be blank");

    return getInternal(key).map(cacheWrapper -> {
        // Check expiration
        // 過期
        if (cacheWrapper.getExpireAt() != null
            && cacheWrapper.getExpireAt().before(run.halo.app.utils.DateUtils.now())) {
            // Expired then delete it
            log.warn("Cache key: [{}] has been expired", key);

            // Delete the key
            delete(key);

            // Return null
            return null;
        }
        // 未過期返回緩存數據
        return cacheWrapper.getData();
    });
}

服務器獲取到 key 對應的 CacheWrapper 對象後,會檢查其中的過期時間,如果數據已過期,那麼直接將其刪除並返回 null。另外,上文中提到,timer(InMemoryCacheStore 的成員變量)的周期任務也負責刪除過期的數據,下面是 timer 周期任務執行的方法:

private class CacheExpiryCleaner extends TimerTask {

    @Override
    public void run() {
        CACHE_CONTAINER.keySet().forEach(key -> {
            if (!InMemoryCacheStore.this.get(key).isPresent()) {
                log.debug("Deleted the cache: [{}] for expiration", key);
            }
        });
    }
}

可見,周期任務也是通過調用 get 方法來刪除過期數據的。

緩存鎖

Halo 項目中的緩存鎖也是一個比較有意思的模塊,其作用是限制用戶對某個功能的調用頻率,可認為是對請求的方法進行加鎖。緩存鎖主要利用自定義註解 @CacheLock 和 AOP 來實現,@CacheLock 註解的定義如下:

@Target(ElementType.METHOD)
@Retention(RetentionPolicy.RUNTIME)
@Documented
@Inherited
public @interface CacheLock {

    @AliasFor("value")
    String prefix() default "";


    @AliasFor("prefix")
    String value() default "";


    long expired() default 5;


    TimeUnit timeUnit() default TimeUnit.SECONDS;


    String delimiter() default ":";


    boolean autoDelete() default true;


    boolean traceRequest() default false;
}

各個成員變量的含義為:

  • prefix:用於構建 cacheLockKey(一個字符串)的前綴。

  • value:同 prefix。

  • expired:緩存鎖的持續時間。

  • timeUnit:持續時間的單位。

  • delimiter:分隔符,構建 cacheLockKey 時使用。

  • autoDelete:是否自動刪除緩存鎖。

  • traceRequest:是否追蹤請求的 IP,如果是,那麼構建 cacheLockKey 時會添加用戶的 IP。

緩存鎖的使用方法是在需要加鎖的方法上添加 @CacheLock 註解,然後通過 Spring 的 AOP 在方法執行前對方法進行加鎖,方法執行結束後再將鎖取消。項目中的切面類為 CacheLockInterceptor,負責加/解鎖的邏輯如下:

Around("@annotation(run.halo.app.cache.lock.CacheLock)")
public Object interceptCacheLock(ProceedingJoinPoint joinPoint) throws Throwable {
    // 獲取方法簽名
    // Get method signature
    MethodSignature methodSignature = (MethodSignature) joinPoint.getSignature();

    log.debug("Starting locking: [{}]", methodSignature.toString());

    // 獲取方法上的 CacheLock 註解
    // Get cache lock
    CacheLock cacheLock = methodSignature.getMethod().getAnnotation(CacheLock.class);
    // 構造緩存鎖的 key
    // Build cache lock key
    String cacheLockKey = buildCacheLockKey(cacheLock, joinPoint);
    System.out.println(cacheLockKey);
    log.debug("Built lock key: [{}]", cacheLockKey);

    try {
        // Get from cache
        Boolean cacheResult = cacheStore
            .putIfAbsent(cacheLockKey, CACHE_LOCK_VALUE, cacheLock.expired(),
                cacheLock.timeUnit());

        if (cacheResult == null) {
            throw new ServiceException("Unknown reason of cache " + cacheLockKey)
                .setErrorData(cacheLockKey);
        }

        if (!cacheResult) {
            throw new FrequentAccessException("訪問過於頻繁,請稍後再試!").setErrorData(cacheLockKey);
        }
        // 執行註解修飾的方法
        // Proceed the method
        return joinPoint.proceed();
    } finally {
        // 方法執行結束後, 是否自動刪除緩存鎖
        // Delete the cache
        if (cacheLock.autoDelete()) {
            cacheStore.delete(cacheLockKey);
            log.debug("Deleted the cache lock: [{}]", cacheLock);
        }
    }
}

@Around("@annotation(run.halo.app.cache.lock.CacheLock)") 表示,如果請求的方法被 @CacheLock 註解修飾,那麼服務器不會執行該方法,而是執行 interceptCacheLock 方法:

  1. 獲取方法上的 CacheLock 註解並構建 cacheLockKey。

  2. 查看緩存中是否存在 cacheLockKey,如果存在,那麼拋出異常,提醒用戶訪問過於頻繁。如果不存在,那麼將 cacheLockKey 存入到緩存(有效時間為 expired),並執行請求的方法。

  3. 如果 CacheLock 註解中的 autoDelete 為 true,那麼方法執行結束後立即刪除 cacheLockKey。

緩存鎖的原理和 Redis 的 setnx + expire 相似,如果 key 已存在,就不能再次添加。下面是構建 cacheLockKey 的邏輯:

private String buildCacheLockKey(@NonNull CacheLock cacheLock,
    @NonNull ProceedingJoinPoint joinPoint) {
    Assert.notNull(cacheLock, "Cache lock must not be null");
    Assert.notNull(joinPoint, "Proceeding join point must not be null");

    // Get the method
    MethodSignature methodSignature = (MethodSignature) joinPoint.getSignature();

    // key 的前綴
    // Build the cache lock key
    StringBuilder cacheKeyBuilder = new StringBuilder(CACHE_LOCK_PREFIX);
    // 分隔符
    String delimiter = cacheLock.delimiter();
    // 如果 CacheLock 中設置了前綴, 那麼直接使用該前綴, 否則使用方法名
    if (StringUtils.isNotBlank(cacheLock.prefix())) {
        cacheKeyBuilder.append(cacheLock.prefix());
    } else {
        cacheKeyBuilder.append(methodSignature.getMethod().toString());
    }
    // 提取被 CacheParam 註解修飾的變量的值
    // Handle cache lock key building
    Annotation[][] parameterAnnotations = methodSignature.getMethod().getParameterAnnotations();

    for (int i = 0; i < parameterAnnotations.length; i++) {
        log.debug("Parameter annotation[{}] = {}", i, parameterAnnotations[i]);

        for (int j = 0; j < parameterAnnotations[i].length; j++) {
            Annotation annotation = parameterAnnotations[i][j];
            log.debug("Parameter annotation[{}][{}]: {}", i, j, annotation);
            if (annotation instanceof CacheParam) {
                // Get current argument
                Object arg = joinPoint.getArgs()[i];
                log.debug("Cache param args: [{}]", arg);

                // Append to the cache key
                cacheKeyBuilder.append(delimiter).append(arg.toString());
            }
        }
    }
    // 是否添加請求的 IP
    if (cacheLock.traceRequest()) {
        // Append http request info
        cacheKeyBuilder.append(delimiter).append(ServletUtils.getRequestIp());
    }
    return cacheKeyBuilder.toString();
}

可以發現,cacheLockKey 的結構為 cache_lock_ + CacheLock 註解中設置的前綴或方法簽名 + 分隔符 + CacheParam 註解修飾的參數的值 + 分隔符 + 請求的 IP,例如:

cache_lock_public void run.halo.app.controller.content.api.PostController.like(java.lang.Integer):1:127.0.0.1

CacheParam 同 CacheLock 一樣,都是為實現緩存鎖而定義的註解。CacheParam 的作用是將鎖的粒度精確到具體的實體,如點贊請求:

@PostMapping("{postId:\\d+}/likes")
@ApiOperation("Likes a post")
@CacheLock(autoDelete = false, traceRequest = true)
public void like(@PathVariable("postId") @CacheParam Integer postId) {
    postService.increaseLike(postId);
}

參數 postId 被 CacheParam 修飾,根據 buildCacheLockKey 方法的邏輯,postId 也將是 cacheLockKey 的一部分,這樣鎖定的就是 “為 id 等於 postId 的文章點贊” 這一方法,而非鎖定 “點贊” 方法。

此外,CacheLock 註解中的 traceRequest 參數也很重要,如果 traceRequest 為 true,那麼請求的 IP 會被添加到 cacheLockKey 中,此時緩存鎖僅限制同一 IP 對某個方法的請求頻率,不同 IP 之間互不干擾。如果 traceRequest 為 false,那麼緩存鎖就是一個分佈式鎖,不同 IP 不能同時訪問同一個功能,例如當某個用戶為某篇文章點贊後,短時間內其它用戶不能為該文章點贊。

最後我們再分析一下 putIfAbsent 方法(在 interceptCacheLock 中被調用),其功能和 Redis 的 setnx 相似,該方法的具體處理邏輯可追蹤到 InMemoryCacheStore 類中的 putInternalIfAbsent 方法:

Boolean putInternalIfAbsent(@NonNull String key, @NonNull CacheWrapper<String> cacheWrapper) {
    Assert.hasText(key, "Cache key must not be blank");
    Assert.notNull(cacheWrapper, "Cache wrapper must not be null");

    log.debug("Preparing to put key: [{}], value: [{}]", key, cacheWrapper);
    // 加鎖
    lock.lock();
    try {
        // 獲取 key 對應的 value
        // Get the value before
        Optional<String> valueOptional = get(key);
        // value 不為空返回 false
        if (valueOptional.isPresent()) {
            log.warn("Failed to put the cache, because the key: [{}] has been present already",
                key);
            return false;
        }
        // 在緩存中添加 value 並返回 true
        // Put the cache wrapper
        putInternal(key, cacheWrapper);
        log.debug("Put successfully");
        return true;
    } finally {
        // 解鎖
        lock.unlock();
    }
}

上節中我們提到,自定義緩存 InMemoryCacheStore 中有一個 ReentrantLock 類型的成員變量 lock,lock 的作用就是保證 putInternalIfAbsent 方法的線程安全性,因為向緩存容器中添加 cacheLockKey 是多個線程並行執行的。如果不添加 lock,那麼當多個線程同時操作同一個 cacheLockKey 時,不同線程可能都會檢測到緩存中沒有 cacheLockKey,因此 putInternalIfAbsent 方法均返回 true,之後多個線程就可以同時執行某個方法,添加 lock 後就能夠避免這種情況。

結語

關於 Halo 項目緩存機制就介紹到這裡了,如有理解錯誤,歡迎大家批評指正 ( ̳• ◡ • ̳)。