基於Redis實現分散式鎖，Redisson使用及原始碼分析

李靜瑤發表於2016-04-17

在分散式場景下，有很多種情況都需要實現最終一致性。在設計遠端上下文的領域事件的時候，為了保證最終一致性，在通過領域事件進行通訊的方式中，可以共享儲存（領域模型和訊息的持久化資料來源），或者做全域性XA事務（兩階段提交，資料來源可分開），也可以藉助訊息中介軟體（消費者處理需要能冪等）。通過Observer模式來發布領域事件可以提供很好的高併發效能，並且事件儲存也能追溯更小粒度的事件資料，使各個應用系統擁有更好的自治性。

本文主要探討另外一種實現分散式最終一致性的解決方案——採用分散式鎖。基於分散式鎖的解決方案，比如zookeeper,redis都是相較於持久化（如利用InnoDB行鎖，或事務，或version樂觀鎖）方案提供了高可用性，並且支援豐富化的使用場景。本文通過Java版本的redis分散式鎖開源框架——Redisson來解析一下實現分散式鎖的思路。

分散式鎖的使用場景

如果是不跨限界上下文的情況，跟本地領域服務相關的資料一致性，儘量還是用事務來保證。但也有些無法用事務或者樂觀鎖來處理的情況，這些情況大多是對於一個共享型的資料來源，有併發寫操作的場景，但又不是對於單一領域的操作。

舉個例子，還是用租書來比喻,A和B兩個人都來租書，在檢視圖書的時候，發現自己想要看的書《大設計》庫存僅剩一本。書店系統中，書作為一種商品，是在商品系統中，以Item表示出租商品的領域模型，同時每一筆交易都會產生一個訂單，Order是在訂單系統（交易限界上下文）中的領域模型。這裡假設先不考慮跨系統通訊的問題（感興趣的可以參考下領域服務、領域事件），也暫時不考慮支付環節，但是我們需要保證A,B兩個人不會都對於《大設計》產生訂單就可以，也就是其中一個人是可以成功下單，另外一個人只要提示庫存已沒即可。此時，書的庫存就是一種共享的分散式資源，下訂單，減庫存就是一個需要保證一致性的寫操作。但又因為兩個操作不能在同一個本地事務，或者說，不共享持久化的資料來源的情況，這時候就可以考慮用分散式鎖來實現。本例子中，就需要對於共享資源——書的庫存進行加鎖，至於鎖的key可以結合領域模型的唯一標識，如itemId,以及操作型別（如操作型別是RENT的）設計一個待加鎖的資源標識。當然，這裡還有一個併發效能的問題，如果是個庫存很多的秒殺型別的業務，那麼就不能單純在itemId 加型別加鎖，還需要設計排隊佇列以及合理的排程演算法，防止超賣等等，那些就是題外話了。本文只是將這個場景作為一個切入點，具體怎麼設計鎖，什麼場景用還要結合業務。

需要解決的問題

分散式的思路和執行緒同步鎖ReentrantLock的思路是一樣的。我們也要考慮如以下幾個問題：

死鎖的情況。複雜的網路環境下，當加鎖成功，後續操作正在處理時，獲得鎖的節點忽然當機，無法釋放鎖的情況。如A在Node1 節點申請到了鎖資源，但是Node1當機，鎖一直無法釋放，訂單沒有生成，但是其他使用者將無法申請到鎖資源。
鎖的效能效率。分散式鎖不能成為效能瓶頸或者單點故障不能導致業務異常。
如果關鍵業務，可能需要重入場景，是否設計成可重入鎖。這個可以參考下在多執行緒的情況下，比如ReentrantLock就是一種可重入鎖，其內部又提供了公平鎖和非公平鎖兩種實現和應用，本文不繼續探討。帶著以上問題，和場景，沿著下文，來一一找到解決方案。

基於Redis實現

Redis 命令

在Redisson介紹前，回顧下Redis的命令，以及不通過任何開源框架，可以基於redis怎麼設計一個分散式鎖。基於不同應用系統實現的語言，也可以通過其他一些如Jedis,或者Spring的RedisOperations 等，來執行Reids命令Redis command list。

分散式鎖主要需要以下redis命令，這裡列舉一下。在實現部分可以繼續參照命令的操作含義。

SETNX key value (SET if Not eXists):當且僅當 key 不存在，將 key 的值設為 value ，並返回1；若給定的 key 已經存在，則 SETNX 不做任何動作，並返回0。詳見：SETNX commond
GETSET key value:將給定 key 的值設為 value ，並返回 key 的舊值 (old value)，當 key 存在但不是字串型別時，返回一個錯誤，當key不存在時，返回nil。詳見：GETSET commond
GET key:返回 key 所關聯的字串值，如果 key 不存在那麼返回 nil 。詳見：GET Commond
DEL key [KEY …]:刪除給定的一個或多個 key ,不存在的 key 會被忽略,返回實際刪除的key的個數（integer）。詳見：DEL Commond
HSET key field value：給一個key 設定一個{field=value}的組合值，如果key沒有就直接賦值並返回1，如果field已有，那麼就更新value的值，並返回0.詳見：HSET Commond
HEXISTS key field:當key 中儲存著field的時候返回1，如果key或者field至少有一個不存在返回0。詳見HEXISTS Commond
HINCRBY key field increment:將儲存在 key 中的雜湊（Hash）物件中的指定欄位 field 的值加上增量 increment。如果鍵 key 不存在，一個儲存了雜湊物件的新建將被建立。如果欄位 field 不存在，在進行當前操作前，其將被建立，且對應的值被置為 0。返回值是增量之後的值。詳見：HINCRBY Commond
PEXPIRE key milliseconds：設定存活時間，單位是毫秒。expire操作單位是秒。詳見:PEXPIRE Commond
PUBLISH channel message:向channel post一個message內容的訊息，返回接收訊息的客戶端數。詳見PUBLISH Commond

Redis 實現分散式鎖

假設我們現在要給itemId 1234 和下單操作 OP_ORDER 加鎖，key是OP_ORDER_1234,結合上面的redis命令，似乎加鎖的時候只要一個SETNX OP_ORDER_1234 currentTimestamp ，如果返回1代表加鎖成功，返回0 表示鎖被佔用著。然後再用DEL OP_ORDER_1234解鎖，返回1表示解鎖成功，0表示已經被解鎖過。然而卻還存在著很多問題：SETNX會存在鎖競爭，如果在執行過程中客戶端當機，也會引起死鎖問題，即鎖資源無法釋放。並且當一個資源解鎖的時候，釋放鎖之後，其他之前等待的鎖沒有辦法再次自動重試申請鎖（除非重新申請鎖）。解決死鎖的問題其實可以可以向Mysql的死鎖檢測學習，設定一個失效時間，通過key的時間戳來判斷是否需要強制解鎖。但是強制解鎖也存在問題，一個就是時間差問題，不同的機器的本地時間可能也存在時間差，在很小事務粒度的高併發場景下還是會存在問題，比如刪除鎖的時候，在判斷時間戳已經超過時效，有可能刪除了其他已經獲取鎖的客戶端的鎖。另外，如果設定了一個超時時間，但是確實執行時間超過了超時時間，那麼鎖會被自動釋放，原來持鎖的客戶端再次解鎖的時候會出現問題，而且最為嚴重的還是一致性沒有得到保障。

所以設計的時候需要考慮以下幾點：

鎖的時效設定。避免單點故障造成死鎖，影響其他客戶端獲取鎖。但是也要保證一旦一個客戶端持鎖，在客戶端可用時不會被其他客戶端解鎖。（網上很多解決方案都是其他客戶端等待佇列長度判斷是否強制解鎖，但其實在偶發情況下就不能保證一致性，也就失去了分散式鎖的意義）。
持鎖期間的check,儘量在關鍵節點檢查鎖的狀態，所以要設計成可重入鎖，但在客戶端使用時要做好吞吐量的權衡。
減少獲取鎖的操作，儘量減少redis壓力。所以需要讓客戶端的申請鎖有一個等待時間，而不是所有申請鎖的請求要迴圈申請鎖。
加鎖的事務或者操作儘量粒度小，減少其他客戶端申請鎖的等待時間，提高處理效率和併發性。
持鎖的客戶端解鎖後，要能通知到其他等待鎖的節點，否則其他節點只能一直等待一個預計的時間再觸發申請鎖。類似執行緒的notifyAll,要能同步鎖狀態給其他客戶端，並且是分散式訊息。
考慮任何執行控制程式碼中可能出現的異常，狀態的正確流轉和處理。比如，不能因為一個節點解鎖失敗，或者鎖查詢失敗（redis 超時或者其他執行時異常），影響整個等待的任務佇列，或者任務池。

鎖設計

由於時間戳的設計有很多問題，以及上述幾個問題，所以再換一種思路。先回顧幾個關於鎖的概念和經典java API。通過一些java.util.concurrent的API來處理一些本地佇列的同步以及等待訊號量的處理。

Semaphore :Semaphore可以控制某個資源可被同時訪問的個數，通過 acquire() 獲取一個許可，如果沒有就等待，而 release() 釋放一個許可。其內部維護了一個int 型別的permits。有一個關於廁所的比喻很貼切，10個人在廁所外面排隊，廁所有5個坑，只能最多進去五個人，那麼就是初始化一個 permits=5的Semaphore。當一個人出來，會release一個坑位，其他等坑的人會被喚醒然後開始要有人進坑。Semaphore同ReentrantLock一樣都是基於AbstractQueuedSynchronizer提供了公平鎖和非公平鎖兩種實現。如果等待的人有秩序的排隊等著，就說明選擇了Semaphore的公平鎖實現，如果外面的人沒有秩序，誰搶到是誰的（活躍執行緒就會一直有機會，存線上程飢餓可能），那就是Semaphore的非公平鎖實現。無論外面人怎麼個等法Semaphore對於出坑的控制是一致的，每次只能是從一個坑裡出來一個人。理解起來，其實就是廁所的5個坑位是一個共享資源，也就是permits的值=5,每次acquire一下就是外面來了個人排隊，每次release一下就是裡面出來個人。廁所聊多有點不雅觀，再回歸到分散式鎖的話題。在剛才講述的redis實現分散式鎖的“第三點”，減少redis申請鎖呼叫頻率上就可以通過Semaphore來控制請求。雖然Semaphore只是虛擬機器內部的鎖粒度的實現（不能跨程式），但是也可以一定程度減輕最後請求redis節點的壓力。當然，也有種方法是，隨機sleep一段時間再去tryLock之類的，也可以達到減輕最後redis節點壓力，但是畢竟使用訊號量能更好得控制。而且我們可以再簡單點，對於同一個鎖物件的申請鎖操作，可以設計一個初始化permits = 0的LockEntry,permits = 0也就顧名思義，誰都進不來，廁所維修中。當有一個持鎖物件unlock的時候，通過分散式訊息機制通知所有等待節點，這時候，再release，這時候permits=1，也就是本虛擬機器中只能有一個執行緒能在acquire（）的阻塞中脫穎而出（當然只是進了坑，但不一定能獲取得到分散式鎖）。
ConcurrentHashMap:這個應該不必多說，之談談在設計分散式鎖中的用途。在上述的“第一點”，對於鎖的時效性的設定裡提到了，要在持鎖執行緒正常執行（持鎖節點沒有當機或內部異常）的時候，保證其一直佔用鎖。只要佔著茅坑的人還在用著，只要他還沒有暴斃或者無聊佔著茅坑不XX,那就應該讓外面的人都等著，不能強行開門託人。再收回來。。。這裡ConcurrentHashMap的key無疑是鎖物件的標識（我們需要設計的redis的key），value就是一個時間任務物件，比如可以netty的TimerTask或其他定時API，定時得觸發給我的鎖重新設定延時。這就是好比（好吧，再次用廁所比喻），蹲在裡面的人的一種主動行為，隔1分鐘敲兩下廁所門，讓外面的等的人知道，裡面的人正在使用中，如果裡面的人1分鐘超過還沒有敲門，可能是裡面人掛掉了，那麼再採取強制措施，直接開門拽人，釋放坑位。

併發API以及一些框架的使用主要是控制鎖的進入和排程，加鎖的流程以及鎖的邏輯也是非常重要。因為redis支援hash結構，除了key作為鎖的標識，還可以利用value的結構

加鎖

下面引數的含義先說明下 :

KEYS[1] ：需要加鎖的key，這裡需要是字串型別。
ARGV[1] ：鎖的超時時間，防止死鎖
ARGV[2] ：鎖的唯一標識，也就是剛才介紹的 id（UUID.randomUUID()） + “:” + threadId

// 檢查是否key已經被佔用，如果沒有則設定超時時間和唯一標識，初始化value=1
if (redis.call('exists', KEYS[1]) == 0) 
then  
redis.call('hset', KEYS[1], ARGV[2], 1); 
redis.call('pexpire', KEYS[1], ARGV[1]);  
return nil; 
end; 
// 如果鎖重入,需要判斷鎖的key field 都一直情況下 value 加一
if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) 
then 
redis.call('hincrby', KEYS[1], ARGV[2], 1);
redis.call('pexpire', KEYS[1], ARGV[1]);//鎖重入重新設定超時時間
return nil; 
end; 
// 返回剩餘的過期時間
return redis.call('pttl', KEYS[1]);

// 檢查是否key已經被佔用，如果沒有則設定超時時間和唯一標識，初始化value=1

if (redis.call('exists', KEYS[1]) == 0)

then

redis.call('hset', KEYS[1], ARGV[2], 1);

redis.call('pexpire', KEYS[1], ARGV[1]);

return nil;

end;

// 如果鎖重入,需要判斷鎖的key field 都一直情況下 value 加一

if (redis.call('hexists', KEYS[1], ARGV[2]) == 1)

then

redis.call('hincrby', KEYS[1], ARGV[2], 1);

redis.call('pexpire', KEYS[1], ARGV[1]);//鎖重入重新設定超時時間

return nil;

end;

// 返回剩餘的過期時間

return redis.call('pttl', KEYS[1]);

以上的方法，當返回空是，說明獲取到鎖，如果返回一個long數值（pttl 命令的返回值），說明鎖已被佔用，通過返回剩餘時間，外部可以做一些等待時間的判斷和調整。

解鎖

也還是先說明一下引數資訊：

– KEYS[1] ：需要加鎖的key，這裡需要是字串型別。

– KEYS[2] ：redis訊息的ChannelName,一個分散式鎖對應唯一的一個channelName:“redisson_lock__channel__{” + getName() + “}”

– ARGV[1] ：reids訊息體，這裡只需要一個位元組的標記就可以，主要標記redis的key已經解鎖，再結合redis的Subscribe，能喚醒其他訂閱解鎖訊息的客戶端執行緒申請鎖。

– ARGV[2] ：鎖的超時時間，防止死鎖

– ARGV[3] ：鎖的唯一標識，也就是剛才介紹的 id（UUID.randomUUID()） + “:” + threadId

// 如果key已經不存在，說明已經被解鎖，直接釋出（publihs）redis訊息
if (redis.call('exists', KEYS[1]) == 0) 
then
redis.call('publish', KEYS[2], ARGV[1]);
return 1;
end;
// key和field不匹配，說明當前客戶端執行緒沒有持有鎖，不能主動解鎖。
if (redis.call('hexists', KEYS[1], ARGV[3]) == 0)
then 
return nil;
end; 
// 將value減1
local counter = redis.call('hincrby', KEYS[1], ARGV[3], -1); 
// 如果counter>0說明鎖在重入，不能刪除key
if (counter > 0)  
then
redis.call('pexpire', KEYS[1], ARGV[2]);                             return 0; 
else 
// 刪除key並且publish 解鎖訊息
redis.call('del', KEYS[1]);                            redis.call('publish', KEYS[2], ARGV[1]); 
return 1; 
end; 
return nil;

// 如果key已經不存在，說明已經被解鎖，直接釋出（publihs）redis訊息

if (redis.call('exists', KEYS[1]) == 0)

then

redis.call('publish', KEYS[2], ARGV[1]);

return 1;

end;

// key和field不匹配，說明當前客戶端執行緒沒有持有鎖，不能主動解鎖。

if (redis.call('hexists', KEYS[1], ARGV[3]) == 0)

then

return nil;

end;

// 將value減1

local counter = redis.call('hincrby', KEYS[1], ARGV[3], -1);

// 如果counter>0說明鎖在重入，不能刪除key

if (counter > 0)

then

redis.call('pexpire', KEYS[1], ARGV[2]); return 0;

else

// 刪除key並且publish 解鎖訊息

redis.call('del', KEYS[1]); redis.call('publish', KEYS[2], ARGV[1]);

return 1;

end;

return nil;

這就是解鎖過程，當然建議提供強制解鎖的介面，直接刪除key，以防一些緊急故障出現的時候，關鍵業務節點受到影響。這裡還有一個關鍵點，就是publish命令，通過在鎖的唯一通道釋出解鎖訊息，可以減少其他分散式節點的等待或者空轉，整體上能提高加鎖效率。至於redis的訊息訂閱可以有多種方式，基於Jedis的訂閱API或者Spring的MessageListener都可以實現訂閱，這裡就可以結合剛才說的Semaphore,在第一次申請鎖失敗後acquire,接收到分散式訊息後release就可以控制申請鎖流程的再次進入。下面結合Redisson原始碼，相信會有更清晰的認識。

使用Redisson示例

Redisson使用起來很方便，但是需要redis環境支援eval命令，否則一切都是悲劇，比如me.結果還是要用RedisCommands去寫一套。例子就如下，獲得一個RLock鎖物件，然後tryLock 和unlock。trylock方法提供了鎖重入的實現，並且客戶端一旦持有鎖，就會在能正常執行期間一直持有鎖，直到主動unlock或者節點故障，主動失效（超過預設的過期時間）釋放鎖。

public boolean doMyBusiness(Object t) {
        RLock lock = redissonClient.getLock(getLockKey(t));
        try {
            if (lock.tryLock()) {
                //do need Business
                return true;
            } else {
                // do other Business or return error.
                return false;
            }
        } finally {
            lock.unlock();
        }
}

public boolean doMyBusiness(Object t) {

RLock lock = redissonClient.getLock(getLockKey(t));

try {

if (lock.tryLock()) {

//do need Business

return true;

} else {

// do other Business or return error.

return false;

}

} finally {

lock.unlock();

}

Redisson還提供了設定最長等待時間以及設定釋放鎖時間的含參tryLock介面 boolean tryLock(long waitTime, long leaseTime, TimeUnit unit) throws InterruptedException; 。Redisson的lock 擴充套件了java.util.concurrent.locks.Lock的實現，也基本按照了Lock介面的實現方案。lock（）方法會一直阻塞申請鎖資源，直到有可用的鎖釋放。下面一部分會詳細解析一部分關鍵實現的程式碼。

Redisson原始碼解析

Redisson 的非同步任務(Future,Promise，FutureListener API)，任務計時器(Timeout，TimerTask)，以及通過AbstractChannel連線redis以及寫入執行批處理命令等很多都是基於netty框架的。po主因為不能使用eval,所以用Spring提供的redisApi ,RedisOperations來處理redis指令，非同步排程等用了Spring的AsyncResult，MessageListener以及一些concurrent api。這裡還是先看一下Redisson的實現。

trylock

這裡以帶引數的trylock解析一下，無參的trylock是一種預設引數的實現。先原始碼走讀一下。

 @Override
    public boolean tryLock(long waitTime, long leaseTime, TimeUnit unit) throws InterruptedException {
        long time = unit.toMillis(waitTime);
        // 申請鎖，返回還剩餘的鎖過期時間
        Long ttl = tryAcquire(leaseTime, unit);
        // 如果為空，表示申請鎖成功
        if (ttl == null) {
            return true;
        }
        // 訂閱監聽redis訊息，並且建立RedissonLockEntry，其中RedissonLockEntry中比較關鍵的是一個 Semaphore屬性物件用來控制本地的鎖請求的訊號量同步，返回的是netty框架的Future實現。
        Future future = subscribe();
        // 阻塞等待subscribe的future的結果物件，如果subscribe方法呼叫超過了time，說明已經超過了客戶端設定的最大wait time，則直接返回false，取消訂閱，不再繼續申請鎖了。
        if (!future.await(time, TimeUnit.MILLISECONDS)) {
            future.addListener(new FutureListener() {
                @Override
                public void operationComplete(Future future) throws Exception {
                    if (future.isSuccess()) {  
                        unsubscribe(future);
                    }
                }
            });
            return false;
        }

        try {
            while (true) {
            // 再次嘗試一次申請鎖
                ttl = tryAcquire(leaseTime, unit);
                // 獲得鎖，返回
                if (ttl == null) {
                    return true;
                }
                // 不等待申請鎖，返回
                if (time 0) {
                    return false;
                }

                // 阻塞等待鎖
                long current = System.currentTimeMillis();
                RedissonLockEntry entry = getEntry();

                if (ttl >= 0 & ttl // 通過訊號量(共享鎖)阻塞,等待解鎖訊息.
                // 如果剩餘時間(ttl)小於wait time ,就在 ttl 時間內，從Entry的訊號量獲取一個許可(除非被中斷或者一直沒有可用的許可)。
                // 否則就在wait time 時間範圍內等待可以通過訊號量
                    entry.getLatch().tryAcquire(ttl, TimeUnit.MILLISECONDS);
                } else {
                    entry.getLatch().tryAcquire(time, TimeUnit.MILLISECONDS);
                }
    // 更新等待時間(最大等待時間-已經消耗的阻塞時間)
                long elapsed = System.currentTimeMillis() - current;
                time -= elapsed;
            }
        } finally {
           // 無論是否獲得鎖,都要取消訂閱解鎖訊息
            unsubscribe(future);
        }

    }

@Override

public boolean tryLock(long waitTime, long leaseTime, TimeUnit unit) throws InterruptedException {

long time = unit.toMillis(waitTime);

// 申請鎖，返回還剩餘的鎖過期時間

Long ttl = tryAcquire(leaseTime, unit);

// 如果為空，表示申請鎖成功

if (ttl == null) {

return true;

}

// 訂閱監聽redis訊息，並且建立RedissonLockEntry，其中RedissonLockEntry中比較關鍵的是一個 Semaphore屬性物件用來控制本地的鎖請求的訊號量同步，返回的是netty框架的Future實現。

Future future = subscribe();

// 阻塞等待subscribe的future的結果物件，如果subscribe方法呼叫超過了time，說明已經超過了客戶端設定的最大wait time，則直接返回false，取消訂閱，不再繼續申請鎖了。

if (!future.await(time, TimeUnit.MILLISECONDS)) {

future.addListener(new FutureListener() {

@Override

public void operationComplete(Future future) throws Exception {

if (future.isSuccess()) {

unsubscribe(future);

}

});

return false;

}

try {

while (true) {

// 再次嘗試一次申請鎖

ttl = tryAcquire(leaseTime, unit);

// 獲得鎖，返回

if (ttl == null) {

return true;

}

// 不等待申請鎖，返回

if (time 0) {

return false;

}

// 阻塞等待鎖

long current = System.currentTimeMillis();

RedissonLockEntry entry = getEntry();

if (ttl >= 0 & ttl // 通過訊號量(共享鎖)阻塞,等待解鎖訊息.

// 如果剩餘時間(ttl)小於wait time ,就在 ttl 時間內，從Entry的訊號量獲取一個許可(除非被中斷或者一直沒有可用的許可)。

// 否則就在wait time 時間範圍內等待可以通過訊號量

entry.getLatch().tryAcquire(ttl, TimeUnit.MILLISECONDS);

} else {

entry.getLatch().tryAcquire(time, TimeUnit.MILLISECONDS);

}

// 更新等待時間(最大等待時間-已經消耗的阻塞時間)

long elapsed = System.currentTimeMillis() - current;

time -= elapsed;

}

} finally {

// 無論是否獲得鎖,都要取消訂閱解鎖訊息

unsubscribe(future);

}

上述方法，呼叫加鎖的邏輯就是在tryAcquire(long leaseTime, TimeUnit unit)中

    private Long tryAcquire(long leaseTime, TimeUnit unit) {
        if (leaseTime != -1) {
            return get(tryLockInnerAsync(leaseTime, unit, Thread.currentThread().getId()));
        }
        return get(tryLockInnerAsync(Thread.currentThread().getId()));
    }

private Long tryAcquire(long leaseTime, TimeUnit unit) {

if (leaseTime != -1) {

return get(tryLockInnerAsync(leaseTime, unit, Thread.currentThread().getId()));

}

return get(tryLockInnerAsync(Thread.currentThread().getId()));

}

tryAcquire(long leaseTime, TimeUnit unit)只是針對leaseTime的不同引數進行不同的轉發處理，再提一下，trylock的無參方法就是直接呼叫了get(tryLockInnerAsync(Thread.currentThread().getId()));

所以下面再看核心的tryLockInnerAsync 基本命令已經在之前解析過，相信這裡看起來應該比較輕鬆，返回的是一個future物件，是為了非同步處理IO，提高系統吞吐量。

Future tryLockInnerAsync(long leaseTime, TimeUnit unit, long threadId) {
        internalLockLeaseTime = unit.toMillis(leaseTime);

        return commandExecutor.evalWriteAsync(getName(), LongCodec.INSTANCE, RedisCommands.EVAL_LONG,
"if (redis.call('exists', KEYS[1]) == 0) then " +
"redis.call('hset', KEYS[1], ARGV[2], 1); " +
"redis.call('pexpire', KEYS[1], ARGV[1]); " +
"return nil; " +
 "end; " +
"if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then " +
"redis.call('hincrby', KEYS[1], ARGV[2], 1); " +
"redis.call('pexpire', KEYS[1], ARGV[1]); " +
"return nil; " +
"end; " +
"return redis.call('pttl', KEYS[1]);",Collections.singletonList(getName()), internalLockLeaseTime, getLockName(threadId));
}

Future tryLockInnerAsync(long leaseTime, TimeUnit unit, long threadId) {

internalLockLeaseTime = unit.toMillis(leaseTime);

return commandExecutor.evalWriteAsync(getName(), LongCodec.INSTANCE, RedisCommands.EVAL_LONG,

"if (redis.call('exists', KEYS[1]) == 0) then " +

"redis.call('hset', KEYS[1], ARGV[2], 1); " +

"redis.call('pexpire', KEYS[1], ARGV[1]); " +

"return nil; " +

"end; " +

"if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then " +

"redis.call('hincrby', KEYS[1], ARGV[2], 1); " +

"redis.call('pexpire', KEYS[1], ARGV[1]); " +

"return nil; " +

"end; " +

"return redis.call('pttl', KEYS[1]);",Collections.singletonList(getName()), internalLockLeaseTime, getLockName(threadId));

}

再說明一下，tryLock(long waitTime, long leaseTime, TimeUnit unit)有leaseTime引數的申請鎖方法是會按照leaseTime時間來自動釋放鎖的。但是沒有leaseTime引數的，比如tryLock()或者tryLock(long waitTime, TimeUnit unit)以及lock()是會一直持有鎖的。再來看一下沒有leaseTime引數的tryLockInnerAsync(Thread.currentThread().getId())

   private FuturetryLockInnerAsync(long threadId) {
   // 設定了預設的30秒的失效時間
        Future ttlRemaining = tryLockInnerAsync(LOCK_EXPIRATION_INTERVAL_SECONDS, TimeUnit.SECONDS, threadId);

        ttlRemaining.addListener(new FutureListener() {
            @Override
            public void operationComplete(Future future) throws Exception {
            // 如果future方法沒有執行完成（IO被中斷等原因）直接返回，不繼續處理
                if (!future.isSuccess()) {
                    return;
                }

                Long ttlRemaining = future.getNow();
                // 成功申請到鎖，開始一個排程程式

                if (ttlRemaining == null) {
                    scheduleExpirationRenewal();
                }
            }
        });
        return ttlRemaining;
    }

private FuturetryLockInnerAsync(long threadId) {

// 設定了預設的30秒的失效時間

Future ttlRemaining = tryLockInnerAsync(LOCK_EXPIRATION_INTERVAL_SECONDS, TimeUnit.SECONDS, threadId);

ttlRemaining.addListener(new FutureListener() {

@Override

public void operationComplete(Future future) throws Exception {

// 如果future方法沒有執行完成（IO被中斷等原因）直接返回，不繼續處理

if (!future.isSuccess()) {

return;

}

Long ttlRemaining = future.getNow();

// 成功申請到鎖，開始一個排程程式

if (ttlRemaining == null) {

scheduleExpirationRenewal();

}

});

return ttlRemaining;

}

這裡比有leaseTime引數的trylock就多了非同步scheduleExpirationRenewal排程。可以繼續看一下,這裡的expirationRenewalMap就是之前降到的一個ConcurrentMap結構。下面的這個排程方式很精妙。除非被unlock的cancleTask方法觸發，否則會一直迴圈重置過期時間。

private static final ConcurrentMap expirationRenewalMap = PlatformDependent.newConcurrentHashMap();  

 private void scheduleExpirationRenewal() {
        // 保證任務不會被重複建立
        if (expirationRenewalMap.containsKey(getName())) {
            return;
        }
        // 新增一個netty的Timeout回撥任務，每（internalLockLeaseTime / 3）毫秒執行一次
        Timeout task = commandExecutor.getConnectionManager().newTimeout(new TimerTask() {
            @Override
            public void run(Timeout timeout) throws Exception {
            // 非同步呼叫redis的pexpire命令，重置過期時間
                expireAsync(internalLockLeaseTime, TimeUnit.MILLISECONDS);
                // 移除，確保下一次呼叫
                expirationRenewalMap.remove(getName());
                scheduleExpirationRenewal(); // 再次迴圈呼叫
            }
        }, internalLockLeaseTime / 3, TimeUnit.MILLISECONDS);
        // expirationRenewalMap如果已經有getName()任務，停止任務，也是為了在極端的併發情況下，保證任務不會被重複建立
        if (expirationRenewalMap.putIfAbsent(getName(), task) != null) {
            task.cancel();
        }
    }

private static final ConcurrentMap expirationRenewalMap = PlatformDependent.newConcurrentHashMap();

private void scheduleExpirationRenewal() {

// 保證任務不會被重複建立

if (expirationRenewalMap.containsKey(getName())) {

return;

}

// 新增一個netty的Timeout回撥任務，每（internalLockLeaseTime / 3）毫秒執行一次

Timeout task = commandExecutor.getConnectionManager().newTimeout(new TimerTask() {

@Override

public void run(Timeout timeout) throws Exception {

// 非同步呼叫redis的pexpire命令，重置過期時間

expireAsync(internalLockLeaseTime, TimeUnit.MILLISECONDS);

// 移除，確保下一次呼叫

expirationRenewalMap.remove(getName());

scheduleExpirationRenewal(); // 再次迴圈呼叫

}

}, internalLockLeaseTime / 3, TimeUnit.MILLISECONDS);

// expirationRenewalMap如果已經有getName()任務，停止任務，也是為了在極端的併發情況下，保證任務不會被重複建立

if (expirationRenewalMap.putIfAbsent(getName(), task) != null) {

task.cancel();

}

這個任務，其實還有一個問題，個人覺得在expirationRenewalMap.containsKey判斷時也加上isLocked判斷會比較好，以防止unlock時出現redis節點異常的時候，任務沒有辦法自動停止，或者設定一個最大執行次數的限制也可以，否則極端情況下也會耗盡本地節點的CPU資源。

unlock

解鎖的邏輯相對簡單，如下，redis 命令相信看起來也會比較輕鬆了。

 @Override
    public void unlock() {
        Boolean opStatus = commandExecutor.evalWrite(getName(), LongCodec.INSTANCE, RedisCommands.EVAL_BOOLEAN,
"if (redis.call('exists', KEYS[1]) == 0) then " +
"redis.call('publish', KEYS[2], ARGV[1]); " +
"return 1; " +
"end;" +
"if (redis.call('hexists', KEYS[1], ARGV[3]) == 0) then " +
"return nil;" +
"end; " +
"local counter = redis.call('hincrby', KEYS[1], ARGV[3], -1); " +
"if (counter > 0) then " +
"redis.call('pexpire', KEYS[1], ARGV[2]); " +
"return 0; " +
"else " +
"redis.call('del', KEYS[1]); " +
"redis.call('publish', KEYS[2], ARGV[1]); " +
"return 1; "+
"end; " +
"return nil;",
Arrays.asList(getName(), getChannelName()), LockPubSub.unlockMessage, internalLockLeaseTime, getLockName(Thread.currentThread().getId()));
    if (opStatus == null) {
            throw new IllegalMonitorStateException("attempt to unlock lock, not locked by current thread by node id: "
                    + id + " thread-id: " + Thread.currentThread().getId());
    }
    // 解鎖成功之後取消更新鎖expire的時間任務
    if (opStatus) {
            cancelExpirationRenewal();
    }

@Override

public void unlock() {

Boolean opStatus = commandExecutor.evalWrite(getName(), LongCodec.INSTANCE, RedisCommands.EVAL_BOOLEAN,

"if (redis.call('exists', KEYS[1]) == 0) then " +

"redis.call('publish', KEYS[2], ARGV[1]); " +

"return 1; " +

"end;" +

"if (redis.call('hexists', KEYS[1], ARGV[3]) == 0) then " +

"return nil;" +

"end; " +

"local counter = redis.call('hincrby', KEYS[1], ARGV[3], -1); " +

"if (counter > 0) then " +

"redis.call('pexpire', KEYS[1], ARGV[2]); " +

"return 0; " +

"else " +

"redis.call('del', KEYS[1]); " +

"redis.call('publish', KEYS[2], ARGV[1]); " +

"return 1; "+

"end; " +

"return nil;",

Arrays.asList(getName(), getChannelName()), LockPubSub.unlockMessage, internalLockLeaseTime, getLockName(Thread.currentThread().getId()));

if (opStatus == null) {

throw new IllegalMonitorStateException("attempt to unlock lock, not locked by current thread by node id: "

+ id + " thread-id: " + Thread.currentThread().getId());

}

// 解鎖成功之後取消更新鎖expire的時間任務

if (opStatus) {

cancelExpirationRenewal();

}

這裡的 cancelExpirationRenewal對應著取消 scheduleExpirationRenewal的重置expire時間任務。

   void cancelExpirationRenewal() {
        Timeout task = expirationRenewalMap.remove(getName());
        if (task != null) {
            task.cancel();
        }
    }

void cancelExpirationRenewal() {

Timeout task = expirationRenewalMap.remove(getName());

if (task != null) {

task.cancel();

}

再看一下Redisson是如何處理unlock的redis訊息的。這裡的訊息內容就是unlockMessage = 0L和unlock方法中publish的內容是對應的。

public class LockPubSub extends PublishSubscribeRedissonLockEntry> {

    public static final Long unlockMessage = 0L;

    @Override
    protected RedissonLockEntry createEntry(Promise newPromise) {
        return new RedissonLockEntry(newPromise);
    }

    @Override
    protected void onMessage(RedissonLockEntry value, Long message) {
        if (message.equals(unlockMessage)) {
        // 釋放一個許可，喚醒等待的entry.getLatch().tryAcquire去再次嘗試獲取鎖。
            value.getLatch().release();
            // 如果entry還有其他Listeners回撥，也喚醒執行。
            synchronized (value) {
                Runnable runnable = value.getListeners().poll();
                if (runnable != null) {
                    if (value.getLatch().tryAcquire()) {
                        runnable.run();
                    } else {
                        value.getListeners().add(runnable);
                    }
                }
            }
        }
    }

}

public class LockPubSub extends PublishSubscribeRedissonLockEntry> {

public static final Long unlockMessage = 0L;

@Override

protected RedissonLockEntry createEntry(Promise newPromise) {

return new RedissonLockEntry(newPromise);

}

@Override

protected void onMessage(RedissonLockEntry value, Long message) {

if (message.equals(unlockMessage)) {

// 釋放一個許可，喚醒等待的entry.getLatch().tryAcquire去再次嘗試獲取鎖。

value.getLatch().release();

// 如果entry還有其他Listeners回撥，也喚醒執行。

synchronized (value) {

Runnable runnable = value.getListeners().poll();

if (runnable != null) {

if (value.getLatch().tryAcquire()) {

runnable.run();

} else {

value.getListeners().add(runnable);

}

Redisson還支援Redis的多種叢集配置，一主一備，一主多備，單機等等。也是通過netty的EventExecutorGroup，Promise，Future等API實現排程的。

結語

在思考是否採用分散式鎖以及採用哪種實現方案的時候，還是要基於業務，技術方案一定是基於業務基礎，服務於業務，並且衡量過投入產出比的。所以如果有成熟的解決方案，在業務可承受規模肯定是不要重複造輪子，當然還要經過嚴謹的測試。在po主用Spring的redis api實現時，也遇到了一些問題。

比如hIncrBy 的字符集問題，在使用命令的時候，當然可以直接set a 1然後incr a 1，這個問題可以參考ERR value is not an integer or out of range 問題，但在使用RedisConnection的時候，需要通過轉碼，byte[] value =SafeEncoder.encode(String.valueOf(“1”)) 再 connection.hSet(key, field, value)這樣才可以，或者自己通過String轉成正確的編碼也可以。

還有剛才說的排程pexpire任務，在unlock異常的時候，任務池中的任務無法自動結束。另外就是Spring的MessageListener的onMessage(Message message, byte[] pattern)回撥方法message.getBody()是byte陣列，訊息內容轉化的時候要處理一下。

資源

打賞支援我寫出更多好文章，謝謝！
打賞作者

打賞支援我寫出更多好文章，謝謝！

基於Redis實現分散式鎖，Redisson使用及原始碼分析

基於Redisson實現分散式鎖原始碼解讀
2021-07-30
Redis分散式原始碼
Springboot基於Redisson實現Redis分散式可重入鎖【案例到原始碼分析】
2022-03-02
Spring BootRedis分散式原始碼
Redis分散式鎖實現Redisson 15問
2022-05-30
Redis分散式
Redis Redisson 分散式鎖的應用和原始碼
2021-10-20
Redis分散式原始碼
基於redis實現分散式鎖
2018-11-19
Redis分散式
使用Redis+Redisson實現分散式鎖的網路文章
2018-08-01
Redis分散式
基於redis的分散式鎖實現
2018-01-06
Redis分散式
【Redisson】分散式鎖的原始碼解析
2023-04-07
Redis分散式原始碼
Redisson實現分散式鎖---原理
2019-06-18
Redis分散式
Redisson實現分散式鎖—RedissonLock
2019-06-19
Redis分散式
redisson實現分散式鎖原理
2017-02-10
Redis分散式
基於redis分散式鎖實現“秒殺”
2019-01-29
Redis分散式
基於Redis實現一個分散式鎖
2021-11-14
Redis分散式
分散式鎖與實現(一)基於Redis實現！
2019-03-22
分散式Redis
Redisson 分散式鎖原始碼 01：可重入鎖加鎖
2021-07-02
Redis分散式原始碼
Springboot中使用Redisson實現分散式鎖
2021-10-10
Spring BootRedis分散式
基於 Redis 實現簡單的分散式鎖
2016-05-21
Redis分散式
使用 Redis 實現分散式鎖
2015-11-26
Redis分散式
Redisson 分散式鎖原始碼 02：看門狗
2021-07-03
Redis分散式原始碼
Redisson 分散式鎖原始碼 11：Semaphore 和 CountDownLatch
2021-07-15
Redis分散式原始碼CountDownLatch
Redisson 分散式鎖原始碼 09：RedLock 紅鎖的故事
2021-07-12
Redis分散式原始碼
redisson之分散式鎖實現原理（三）
2022-06-16
Redis分散式
基於 Redis 分散式鎖
2022-04-15
Redis分散式
Redisson 分散式鎖實現之原始碼篇 → 為什麼推薦用 Redisson 客戶端
2021-07-05
Redis分散式原始碼客戶端
java 實現開箱即用基於 redis 的分散式鎖
2022-12-14
JavaRedis分散式
基於redis和zookeeper的分散式鎖實現方式
2018-06-15
Redis分散式
基於Redis的分散式鎖的簡單實現
2018-01-27
Redis分散式
Redisson分散式鎖
2022-07-05
Redis分散式
如何使用Redis實現分散式鎖
2024-07-17
Redis分散式
redis實現分散式鎖（包含程式碼以及分析利弊）
2023-02-11
Redis分散式
年輕人, 看看 Redisson 是如何實現分散式鎖
2020-11-27
Redis分散式
基於 Redis 的分散式鎖
2018-04-02
Redis分散式
基於redis的分散式鎖
2018-06-28
Redis分散式
基於redis做分散式鎖
2024-03-11
Redis分散式
Golang 基於單節點 Redis 實現的分散式鎖
2020-07-05
GolangRedis分散式
基於ZK實現分散式鎖
2018-05-26
分散式
分散式鎖----Redis實現
2019-07-26
分散式Redis
Redis實現分散式鎖
2019-02-16
Redis分散式

基於Redis實現分散式鎖，Redisson使用及原始碼分析

分散式鎖的使用場景

需要解決的問題

基於Redis實現

Redis 命令

Redis 實現分散式鎖

鎖設計

加鎖

解鎖

使用Redisson示例

Redisson原始碼解析

trylock

unlock

結語

資源

打賞支援我寫出更多好文章，謝謝！

相關文章