原始碼|併發一枝花之ConcurrentLinkedQueue【偽】

monkeysayhi發表於2017-12-04

首先宣告，本文是偽原始碼分析。主要是基於狀態機自己實現一個簡化的併發佇列，有助於讀者掌握併發程式設計的核心——狀態機；最後對原始碼實現略有提及。

ConcurrentLinkedQueue不支援阻塞，沒有BlockingQueue那麼易用；但在中等規模的併發場景下，其效能卻比BlockingQueue高不少，而且相當穩定。同時，ConcurrentLinkedQueue是學習CAS的經典案例。根據github的code results排名，ConcurrentLinkedQueue（164k）也十分流行，比我想象中的使用量大多了。非常值得一講。

對於狀態機和併發程式設計的基本理解，可以參考原始碼|併發一枝花之BlockingQueue，建議第一次接觸狀態機的同學速讀參考文章之後，再來閱讀此文章。

JDK版本：oracle java 1.8.0_102

準備知識：CAS

讀者可以跳過這部分，後面講到offer()方法的實現時再回顧。

悲觀鎖與樂觀鎖

悲觀鎖：假定併發環境是悲觀的，如果發生併發衝突，就會破壞一致性，所以要通過獨佔鎖徹底禁止衝突發生。有一個經典比喻，“如果你不鎖門，那麼搗蛋鬼就回闖入並搞得一團糟”，所以“你只能一次開啟門放進一個人，才能時刻盯緊他”。
樂觀鎖：假定併發環境是樂觀的，即，雖然會有併發衝突，但衝突可發現且不會造成損害，所以，可以不加任何保護，等發現併發衝突後再決定放棄操作還是重試。可類比的比喻為，“如果你不鎖門，那麼雖然搗蛋鬼會闖入，但他們一旦打算破壞你就能知道”，所以“你大可以放進所有人，等發現他們想破壞的時候再做決定”。

通常認為樂觀鎖的效能比悲觀所更高，特別是在某些複雜的場景。這主要由於悲觀鎖在加鎖的同時，也會把某些不會造成破壞的操作保護起來；而樂觀鎖的競爭則只發生在最小的併發衝突處，如果用悲觀鎖來理解，就是“鎖的粒度最小”。但樂觀鎖的設計往往比較複雜，因此，複雜場景下還是多用悲觀鎖。

首先保證正確性，有必要的話，再去追求效能。

CAS

樂觀鎖的實現往往需要硬體的支援，多數處理器都都實現了一個CAS指令，實現“Compare And Swap”的語義（這裡的swap是“換入”，也就是set），構成了基本的樂觀鎖。

CAS包含3個運算元：

需要讀寫的記憶體位置V
進行比較的值A
擬寫入的新值B

當且僅當位置V的值等於A時，CAS才會通過原子方式用新值B來更新位置V的值；否則不會執行任何操作。無論位置V的值是否等於A，都將返回V原有的值。

一個有意思的事實是，“使用CAS控制併發”與“使用樂觀鎖”並不等價。CAS只是一種手段，既可以實現樂觀鎖，也可以實現悲觀鎖。樂觀、悲觀只是一種併發控制的策略。下文將分別用CAS實現悲觀鎖和樂觀鎖？我們先不講JDK提供的實現，用狀態機模型來分析一下，看我們能不能自己實現一版。

佇列的狀態機模型

狀態機模型與是否需要併發無關，一個類不管是否是執行緒安全的，其狀態機模型從類被實現（此時，所有類行為都是確定的）開始就是確定的。介面是類行為的一個子集，我們從介面出發，逐漸構建出簡化版ConcurrentLinkedQueue的狀態機模型。

佇列介面

ConcurrentLinkedQueue實現了Queue介面：

public interface BlockingQueue<E> extends Queue<E> {
  boolean add(E e);

  boolean offer(E e);

  E remove();

  E poll();

  E element();
  
  E peek();
}
複製程式碼

需要關注的是一對方法：

offer()：入隊，成功返回true，失敗返回false。JDK中ConcurrentLinkedQueue實現為無界佇列，這裡我們也只討論無界的情況——因此，offer()方法必返回true。
poll()：出隊，有元素返回元素，沒有就返回null。

同時，理想的執行緒安全佇列中，入隊和出隊之間不應該存在競爭，這樣入隊的狀態機模型和出隊的狀態機模型可以完全解耦，互不影響。

對我們的狀態機作出兩個假設：

假設1：只支援這入隊、出隊兩種行為。
假設2：入隊、出隊之間不存在競爭，即入隊模型與出隊模型是對偶、獨立的兩個狀態機。

從而，可以先分析入隊，再參照分析出隊；然後可嘗試去掉假設2，看如何完善我們的實現來保證假設2成立；最後看看真·神Doug Lea如何實現，學習一波。

狀態機定義

現在基於假設1和假設2，嘗試定義入隊模型的狀態機。

我們構造一個簡化的場景：存在2個生產者P1、P2，同時觸發入隊操作。

狀態集

如果是單執行緒環境，入隊操作將是這樣的：

// 準備
newNode.next = null;
curTail = tail;

// 入隊前
assert tail == curTail && tail.next == null; // 狀態S1
// 開始入隊
tail.next = newNode; // 事件E1
// 入隊中
assert tail == curTail && tail.next == newNode; // 狀態S2
tail = tail.next; // 事件E2
// 結束入隊
// 入隊後
assert tail == newNode && tail.next == null; // 狀態S3，合併到狀態S1
複製程式碼

該過程涉及對兩個域的修改：tail.next、tail。則隨著操作的進行，佇列會經歷2種狀態：

狀態S1：事件E1執行前，tail指向實際的尾節點curTail，tail.next==null。如生產者P1、P2都還沒有觸發入隊時，佇列處於狀態S1；生產者P1完成入隊P2還沒觸發入隊時，佇列處於狀態S1。
狀態S2：事件E1執行後、E2執行前，tail指向舊的尾節點curTail，tail.next==newNode。
~~狀態S3：事件E2執行後，tail指向新的尾節點newNode，tail.next==null。同狀態S1，合併。~~

狀態轉換集

兩個事件分別對應兩個狀態轉換：

狀態轉換T1：S1->S2，即tail.next = newNode。
狀態轉換T2：S2->S1，即tail = tail.next。

是不是很熟悉？因為ConcurrentLinkedQueue也是佇列，必然同BlockingQueue相似甚至相同。區別在於如何維護這些狀態和狀態轉換。

自擼ConcurrentLinkedQueue

依賴CAS，兩個狀態轉換T1、T2都可以實現為原子操作。留給我們的問題是，如何維護合法的狀態轉換。

入隊方法offer()

入隊過程需要經過兩個狀態轉換，且這兩個狀態轉換必須連續發生。

不嚴謹。“連續”並不是必要的，最後分析原始碼的時候會看到。不過，我們暫時使用強一致性的模型。

思路1：讓同一個生產者P1連續完成兩個狀態轉換T1、T2，保證P2不會插入進來

LinkedBlockingQueue的思路即是如此。這是一種悲觀策略——一次開門只放進來一個生產者，似乎只能像LinkedBlockingQueue那樣，用傳統的鎖putLock實現，實際上，依靠CAS也能實現：

public class ConcurrentLinkedQueue1<E> {
  private volatile Node<E> tail;

  public ConcurrentLinkedQueue1() {
    throw new UnsupportedOperationException("Not implement");
  }

  public boolean offer(E e) {
    Node<E> newNode = new Node<E>(e, new AtomicReference<>(null));
    while (true) {
      Node<E> curTail = tail;
      AtomicReference<Node<E>> curNext = curTail.next;
      // 嘗試T1：CAS設定tail.next
      if (curNext.compareAndSet(null, newNode)) {
        // 成功者視為獲得獨佔鎖，完成了T1。直接執行T2：設定tail
        tail = curNext.get();
        return true;
      }
      // 失敗者自旋等待
    }
  }

  private static class Node<E> {
    private volatile E item;
    private AtomicReference<Node<E>> next;

    public Node(E item, AtomicReference<Node<E>> next) {
      this.item = item;
      this.next = next;
    }
  }
}
複製程式碼

思路2：生產者P1完成狀態轉換T1後，P2代勞完成狀態轉換T2

再來分析下T1、T2兩個狀態轉換：

T1涉及newNode，只能由封閉持有newNode的生產者P1完成
T2只涉及佇列中的資訊，任何持有佇列的生產者都有能力完成。P1可以，P2也可以

思路1是悲觀的，認為T1、T2必須都由P1完成，如果P2插入就會“搞破壞”。而思路2則開啟大門，歡迎任何“有能力”的生產者完成T2，是典型的樂觀策略。

public class ConcurrentLinkedQueue2<E> {
  private AtomicReference<Node<E>> tail;

  public ConcurrentLinkedQueue2() {
    throw new UnsupportedOperationException("Not implement");
  }

  public boolean offer(E e) {
    Node<E> newNode = new Node<E>(e, new AtomicReference<>(null));
    while (true) {
      Node<E> curTail = tail.get();
      AtomicReference<Node<E>> curNext = curTail.next;
      // 嘗試T1：CAS設定tail.next
      if (curNext.compareAndSet(null, newNode)) {
        // 成功者完成了T1，佇列處於S2，繼續嘗試T2：CAS設定tail
        tail.compareAndSet(curTail, curNext.get());
        // 成功表示該生產者P1完成連續完成了T1、T2，佇列處於S1
        // 失敗表示T2已經由生產者P2完成，佇列處於S1
        return true;
      }
      // 失敗者得知佇列處於S2，則嘗試T2：CAS設定tail
      tail.compareAndSet(curTail, curNext.get());
      // 如果成功，佇列轉換到S1；如果失敗，佇列表示T2已經由生產者P1完成，佇列已經處於S1
      // 然後迴圈，重新嘗試T1
    }
  }

  private static class Node<E> {
    private volatile E item;
    private AtomicReference<Node<E>> next;

    public Node(E item, AtomicReference<Node<E>> next) {
      this.item = item;
      this.next = next;
    }
  }
}
複製程式碼

減少無效的競爭

我們涉及的狀態比較少（只有2個狀態），繼續看看能否減少無效的競爭，比如：

前兩種實現的第一步都是CAS嘗試T1，失敗了就退化成一次探查（compare and swap中的compare）。發起CAS前，可能佇列已經處於S2，這時CAS嘗試T1就成了浪費，只需要探查即可。這有點像DCL單例的思路(面試中單例模式有幾種寫法？)，可以直接通過tail.next判斷佇列是否處於S1，來完成一部分探查，以減少無效的競爭。

public class ConcurrentLinkedQueue3<E> {
  private AtomicReference<Node<E>> tail;

  public ConcurrentLinkedQueue3() {
    throw new UnsupportedOperationException("Not implement");
  }

  public boolean offer(E e) {
    Node<E> newNode = new Node<E>(e, new AtomicReference<>(null));
    while (true) {
      Node<E> curTail = tail.get();
      AtomicReference<Node<E>> curNext = curTail.next;

      // 先檢查一下佇列狀態的狀態，tail.next==null表示佇列處於狀態S1，僅此時才有CAS嘗試T1的必要
      if (curNext.get() == null) {
        // 如果處於S1，嘗試T1：CAS設定tail.next
        if (curNext.compareAndSet(null, newNode)) {
          // 成功者完成了T1，佇列處於S2，繼續嘗試T2：CAS設定tail
          tail.compareAndSet(curTail, curNext.get());
          // 成功表示該生產者P1完成連續完成了T1、T2，佇列處於S1
          // 失敗表示T2已經由生產者P2完成，佇列處於S1
          return true;
        }
      }
      // 否則佇列處於處於S2，或CAS嘗試T1的失敗者得知佇列處於S2，則嘗試T2：CAS設定tail
      tail.compareAndSet(curTail, curNext.get());
      // 如果成功，佇列轉換到S1；如果失敗，佇列表示T2已經由生產者P1完成，佇列已經處於S1
      // 然後迴圈，重新嘗試T1
    }
  }

  private static class Node<E> {
    private volatile E item;
    private AtomicReference<Node<E>> next;

    public Node(E item, AtomicReference<Node<E>> next) {
      this.item = item;
      this.next = next;
    }
  }
}
複製程式碼

注意，上述實現中，while程式碼塊後都沒有返回值。這是被編譯器允許的，因為編譯器可以分析出，該方法不可能執行到while程式碼塊之後，所以while程式碼塊後的返回值語句也是無效的。

出隊方法poll()

對偶的構造一個簡化的場景：存在2個消費者C1、C2，同時觸發出隊操作。

不需要考慮悲觀策略和優化方案，我們嘗試基於思路2的第一種實現擼一版基礎的poll()方法。

然後，，，沒擼動。想了一下，樸素連結串列（如LinkedList）中，直接用head表示維護頭結點無法區分“已取出item未移動head指標”和“未取出item未移動head指標”（同“已取出item已移動head指標”）兩種狀態。所以還是寫一寫才知道深淺啊，碰巧前兩天寫了BlockingQueue的分析，dummy node正好派上用場。

佇列初始化如下：

dummy = new Node(null, null);
// tail = dummy; // 後面會用到
// head = dummy.next; // dummy.next 表示實際的頭結點，但我們不需要儲存它
複製程式碼

狀態機

單執行緒環境的出隊過程：

// 準備
curDummy = dummy;
curNext = curDummy.next;
oldItem = curNext.item;

// 出隊前
assert dummy == curDummy && dummy.next.item == oldItem; // 狀態S1
// 開始出隊
dummy.next.item = null; // 事件E1
// 出隊中
assert dummy == curDummy && dummy.next.item == null; // 狀態S2
dummy = dummy.next; // 事件E2
// 結束出隊
// 出隊後
assert dummy == curNext && dummy.next.item != null; // 狀態S3，合併到狀態S1
複製程式碼

狀態：

狀態S1：事件E1執行前，dummy指向實際的dummy節點curDummy，dummy.next.item== oldItem。如消費者C1、C2都還沒有觸發出隊時，佇列處於狀態S1；消費者C1完成入隊C2還沒觸發出隊時，佇列處於狀態S1。
狀態S2：事件E1執行後、E2執行前，dummy指向舊的dummy節點curDummy，dummy.next.item==null。
~~狀態S3：事件E2執行後，dummy指向新的dummy節點curNext，dummy.next.item!=null。這在本質上同狀態S1是一致的，合併。~~

狀態轉換：

狀態轉換T1：S1->S2，即dummy.next.item = null。
狀態轉換T2：S2->S1，即dummy = dummy.next。

程式碼

public class ConcurrentLinkedQueue4<E> {
  private AtomicReference<Node<E>> dummy;

  public ConcurrentLinkedQueue4() {
    dummy = new AtomicReference<>(new Node<>(null, null));
  }

  public E poll() {
    while (true) {

      Node<E> curDummy = dummy.get();
      Node<E> curNext = curDummy.next;
      E oldItem = curNext.item.get();
      // 嘗試T1：CAS設定dummy.next.item
      if (curNext.item.compareAndSet(oldItem, null)) {
        // 成功者完成了T1，佇列處於S2，繼續嘗試T2：CAS設定dummy
        dummy.compareAndSet(curDummy, curNext);
        // 成功表示該消費者C1完成連續完成了T1、T2，佇列處於S1
        // 失敗表示T2已經由消費者C2完成，佇列處於S1
        return oldItem;
      }
      // 失敗者得知佇列處於S2，則嘗試T2：CAS設定dummy
      dummy.compareAndSet(curDummy, curNext);
      // 如果成功，佇列轉換到S1；如果失敗，佇列表示T2已經由消費者P1完成，佇列已經處於S1
      // 然後迴圈，重新嘗試T1
    }
  }

  private static class Node<E> {
    private AtomicReference<E> item;
    private volatile Node<E> next;

    public Node(AtomicReference<E> item, Node<E> next) {
      this.item = item;
      this.next = next;
    }
  }
}
複製程式碼

另一種狀態機

實際上，前面的討論有意迴避了一個問題——如果入隊/出隊操作順序不同，我們會構造出不同的狀態機。這相當於同一個類的另一種實現，不違反前面作出的宣告：

狀態機模型與是否需要併發無關，一個類不管是否是執行緒安全的，其狀態機模型從類被實現（此時，所有類行為都是確定的）開始就是確定的。

繼續以出隊為例，假設在單執行緒下，採用這樣的順序出隊：

// 準備
curDummy = dummy;
curNext = curDummy.next;
oldItem = curNext.item;

// 出隊前
assert dummy == curDummy && dummy.item == null; // 狀態S1

// 開始出隊
dummmy = dummy.next; // 事件E1
// 出隊中
assert dummy == curNext && dummy.item == oldItem; // 狀態S2
dummy.item = null; // 事件E2
// 結束出隊

// 出隊後
assert dummy == curNext && dummy.item == null; // 狀態S3，合併到狀態S1
複製程式碼

看起來，這樣的操作順序更容易定義各狀態：

狀態S1：事件E1執行前，dummy指向實際的dummy節點curDummy，dummy.item == null。如消費者C1、C2都還沒有觸發出隊時，佇列處於狀態S1；消費者C1完成入隊C2還沒觸發出隊時，佇列處於狀態S1。
狀態S2：事件E1執行後、E2執行前，dummy指向新的dummy節點curNext，dummy.item == oldItem。
~~狀態S3：事件E2執行後，dummy指向新的dummy節點curNext，dummy.item == null。顯然同狀態S1，合併。~~

狀態轉換：

狀態轉換T1：S1->S2，即dummmy = dummy.next。
狀態轉換T2：S2->S1，即dummy.item = null。

實現如下：

public class ConcurrentLinkedQueue5<E> {
  private AtomicReference<Node<E>> dummy;

  public ConcurrentLinkedQueue5() {
    dummy = new AtomicReference<>(new Node<>(null, null));
  }

  public E poll() {
    while (true) {

      Node<E> curDummy = dummy.get();
      Node<E> curNext = curDummy.next;
      E oldItem = curNext.item.get();
      // 嘗試T1：CAS設定dummmy
      if (dummy.compareAndSet(curDummy, curNext)) {
        // 成功者完成了T1，佇列處於S2，繼續嘗試T2：CAS設定dummy.item
        curDummy.item.compareAndSet(oldItem, null);
        // 成功表示該消費者C1完成連續完成了T1、T2，佇列處於S1
        // 失敗表示T2已經由消費者C2完成，佇列處於S1
        return oldItem;
      }
      // 失敗者得知佇列處於S2，則嘗試T2：CAS設定dummy.item
      curDummy.item.compareAndSet(oldItem, null);
      // 如果成功，佇列轉換到S1；如果失敗，佇列表示T2已經由消費者P1完成，佇列已經處於S1
      // 然後迴圈，重新嘗試T1
    }
  }

  private static class Node<E> {
    private AtomicReference<E> item;
    private volatile Node<E> next;

    public Node(AtomicReference<E> item, Node<E> next) {
      this.item = item;
      this.next = next;
    }
  }
}
複製程式碼

一個trick

實現上面狀態機的過程中，我想出了一個針對出隊操作的trick：可以去掉dummy node，用head維護頭結點+一步狀態轉換完成出隊。

對啊，我寫著寫著又擼出來了。。。

去掉了dummy node，那麼head.item的初始狀態就是非空的，下面是簡化的狀態機。

單執行緒出隊的操作順序：

// 準備
curHead = head;
curNext = curHead.next;
oldItem = curHead.item;

// 出隊前
assert head == curHead; // 狀態S1

// 出隊
head = head.next; // 事件E1

// 出隊後
assert head == curNext; // 狀態S2，合併到狀態S1
複製程式碼

出隊只需要嘗試head後移，成功者可從舊的頭結點curHead中取出item，之後curHead將被廢棄；失敗者再重新嘗試即可。如果在嘗試前就得到了item的引用，那麼E1發生後，不管成功與否，在curHead上做什麼都是無所謂的了，因為事實上沒有任何消費者會再去訪問它。

這是一個單狀態的狀態機，則狀態：

狀態S1：head指向實際的頭節點curHead。佇列始終處於狀態S1。
~~狀態S2：head指向新的頭節點curNext。同S1，合併~~

狀態轉換：

狀態轉換T1：S1->S1，即head = head.next。

實現如下：

public class ConcurrentLinkedQueue6<E> {
  private AtomicReference<Node<E>> head;

  public ConcurrentLinkedQueue6() {
    throw new UnsupportedOperationException("Not implement");
  }

  public E poll() {
    while (true) {

      Node<E> curHead = head.get();
      Node<E> curNext = curHead.next;
      // 嘗試T1：CAS設定head
      if (head.compareAndSet(curHead, curNext)) {
        // 成功者完成了T1，佇列處於S1
        return curHead.item; // 只讓成功者取出item
      }
      // 失敗者重試嘗試
    }
  }

  private static class Node<E> {
    private volatile E item;
    private volatile Node<E> next;

    public Node(E item, Node<E> next) {
      this.item = item;
      this.next = next;
    }
  }
}
複製程式碼

其他特殊情況

前面都是基於假設2“入隊、出隊無競爭”討論的。現在需要放開假設2，看如何完善已有的實現以保證假設2成立。或者如果不能保證假設2的話，如何解決競爭問題。

根據對LinkedBlockingQueue的分析，我們得知，如果底層資料結構是樸素連結串列，那麼佇列空或長度為1的時候，head、tail都指向同一個節點（或都為null）,這時必然存在競爭；dummy node較好的解決了這一問題。ConcurrentLinkedQueue4是基於dummy node的方案，我們嘗試在此基礎上修改。

回顧dummy node的使用方法（配合ConcurrentLinkedQueue2和ConcurrentLinkedQueue4做了調整和精簡）:

初始化連結串列時，建立dummy node：
- dummy = new Node(null, null)
- // head = dummy.next // head 為 null <=> 佇列空
- tail = dummy // tail.item 為 null <=> 佇列空
在隊尾入隊時，tail後移：
- tail.next = new Node(newItem, null)
- tail = tail.next
在隊頭出隊時，dummy後移，同步更新head：
- oldItem = dummy.next.item // == head.item
- dummy.next.item = null
- dummy = dummy.next
- // head = dummy.next
- return oldItem

下面分情況討論。

case1：佇列空

佇列空時，佇列處於一個特殊的狀態，從該狀態出發，僅能完成入隊相關的狀態轉換——通俗講就是佇列空時只允許入隊操作。這時消除競爭很簡單，只允許入隊不允許出隊即可：

public class ConcurrentLinkedQueue7<E> {
  private AtomicReference<Node<E>> dummy;
  private AtomicReference<Node<E>> tail;

  public ConcurrentLinkedQueue7() {
    Node<E> initNode = new Node<E>(
        new AtomicReference<E>(null), new AtomicReference<Node<E>>(null));
    dummy = new AtomicReference<>(initNode);
    tail = new AtomicReference<>(initNode);
    // Node<E> head = dummy.get().next.get();
  }

  public boolean offer(E e) {
    Node<E> newNode = new Node<E>(new AtomicReference<>(e), new AtomicReference<>(null));
    while (true) {
      Node<E> curTail = tail.get();
      AtomicReference<Node<E>> curNext = curTail.next;
      if (curNext.compareAndSet(null, newNode)) {
        tail.compareAndSet(curTail, curNext.get());
        return true;
      }
      tail.compareAndSet(curTail, curNext.get());
    }
  }

  public E poll() {
    while (true) {
      Node<E> curDummy = dummy.get();
      Node<E> curNext = curDummy.next.get();
      // 既可以用 dummy.next == null (head) 判空，也可以用 tail.item == null
      // 不過鑑於處於poll()方法中，使用 dummy.next 可讀性更好
      if (curNext == null) {
        return null;
      }
      E oldItem = curNext.item.get();
      if (curNext.item.compareAndSet(oldItem, null)) {
        dummy.compareAndSet(curDummy, curNext);
        return oldItem;
      }
      dummy.compareAndSet(curDummy, curNext);
    }
  }

  private static class Node<E> {
    private AtomicReference<E> item;
    private AtomicReference<Node<E>> next;

    public Node(AtomicReference<E> item, AtomicReference<Node<E>> next) {
      this.item = item;
      this.next = next;
    }
  }
}
複製程式碼

ConcurrentLinkedQueue7需要原子的操作item和next，因此Node的item、next域都被宣告為了AtomicReference。

佇列空的時候：offer()方法同ConcurrentLinkedQueue2#offer()，不需要做特殊處理；poll()方法在ConcurrentLinkedQueue4#poll()的基礎上，增加了32-34行的佇列空檢查。需要注意的是，檢查必須放在佇列轉換的過程中，防止消費者C2第一次嘗試時佇列非空，但第二次嘗試時佇列變空（由於C1取出了唯一的元素）的情況。

case2：佇列長度等於1

佇列長度等於1時，入隊與出隊不會同時修改同一節點，這時一定不會發生競爭。分析如下。

假設存在一個生產者P1，一個消費者C1，同時觸發入隊/出隊，佇列中只有一個元素，所以只兩個節點dummyNode、singleNode則此時：

assert dummy == dummyNode;
assert dummy.next.item == singleNode.item;

assert tail == singleNode;
assert tail.next == singleNode.next;
複製程式碼

回顧ConcurrentLinkedQueue7的實現:

poll()方法修改引用dummy、singleNode.item
offer()方法操tail、singleNode.next

因此，由於dummy node的引入，佇列長度為1時，入隊、出隊之間天生就不存在競爭。

小結

至此，我們從最簡單的場景觸發，基於狀態機實現了一個支援高效能offer()、poll()方法的ConcurrentLinkedQueue7。CAS的好處暫且不表，重要的是基於狀態機進行併發程式設計的思想。只有抓住其狀態機的本質，才能設計出正確、高效的併發類。

如果還是沒有體會到狀態機的精妙之處，可以拋開狀態機，並自己嘗試基於樂觀策略實現ConcurrentLinkedQueue。（之所以要基於樂觀策略，是因為悲觀策略可以認為是樂觀策略的是特例，容易讓人忽略其狀態機的本質）

JDK實現

希望看到這裡，你已經理解了ConcurrentLinkedQueue的狀態機本質，因為下面就不再是本文的重點。

真·神Doug Lea的實現基於一個弱一致性的狀態機：允許佇列處於多種不一致的狀態，通過恰當的選擇“不一致的狀態”，能做到使用者無感；雖然增加了狀態機的複雜度，但也進一步提高了效能。

網上分析文章非常多，讀者可自行閱讀，有一定難度。本文不打算講解Doug Lea的實現，貼出原始碼僅供大家膜拜。

構造方法

常用的是預設的空建構函式：

public class ConcurrentLinkedQueue<E> extends AbstractQueue<E>
        implements Queue<E>, java.io.Serializable {
...
    private transient volatile Node<E> head;
    private transient volatile Node<E> tail;
    public ConcurrentLinkedQueue() {
        head = tail = new Node<E>(null);
    }
...
}
複製程式碼

Doug Lea也使用了dummy node，不過命名為了head。初始化方法同我們實現的ConcurrentLinkedQueue7。

入隊方法offer()

ConcurrentLinkedQueue7#offer()相當於ConcurrentLinkedQueue#offer()的一個特例。

public boolean offer(E e) {
    checkNotNull(e);
    final Node<E> newNode = new Node<E>(e);

    for (Node<E> t = tail, p = t;;) {
        Node<E> q = p.next;
        if (q == null) {
            if (p.casNext(null, newNode)) {
                if (p != t)
                    casTail(t, newNode);
                return true;
            }
        }
        else if (p == q)
            p = (t != (t = tail)) ? t : head;
        else
            p = (p != t && t != (t = tail)) ? t : q;
    }
}
複製程式碼

具體來講，ConcurrentLinkedQueue允許的多個狀態大體是這樣的：

狀態S1：一致；newNode已銜接在tail.next，但tail指向倒數第1個節點
狀態S2：不一致；newNode已銜接在tail.next，但tail指向倒數第2個節點
狀態S3：不一致；newNode已銜接在tail.next，但tail指向倒數第3個節點
...

狀態轉換的規則也隨之打破——不再需要連續完成T1、T2，可以連續執行多次類T1，最後執行一次類T2。

for迴圈中的幾個分支就是在處理這些一致和不一致的狀態。我們前面定義的狀態機空間中只允許狀態S1、S2，因此是一個子集。增加的這些不一致的狀態主要是為了減少CAS次數，進一步提高佇列效能，這包含兩個重要意義：

降低延遲：部分入隊請求不再需要走完完整的狀態轉換，只需要迴圈到tail.next.cas(null, newNode)成功。
提高吞吐：之前每一次入隊請求都要設定一次tail節點；目前只需要積攢幾次入隊，在某個新的newNode入隊時，直接嘗試tail.cas(t, newNode)，將tail跳躍到最新的newNode。

增加這些不一致的狀態是很危險的，如S3，當佇列長度為1的時候，tail與head的位置存在交叉。Doug Lea牛逼之處在於，在保證正確性的前提下，不僅通過增加狀態提高了效能，還減少了實際的CAS次數。

出隊方法poll()

public E poll() {
    restartFromHead:
    for (;;) {
        for (Node<E> h = head, p = h, q;;) {
            E item = p.item;

            if (item != null && p.casItem(item, null)) {
                if (p != h)
                    updateHead(h, ((q = p.next) != null) ? q : p);
                return item;
            }
            else if ((q = p.next) == null) {
                updateHead(h, p);
                return null;
            }
            else if (p == q)
                continue restartFromHead;
            else
                p = q;
        }
    }
}
final void updateHead(Node<E> h, Node<E> p) {
    if (h != p && casHead(h, p))
        h.lazySetNext(h);
}
複製程式碼

分析方法類似於offer()。注意下updateHead()。

未完

本來是想分析ConcurrentLinkedQueue原始碼的，沒想到寫完狀態機就3600多字了，乾貨卻不多。前路漫漫，原始碼我們下回見。

本文連結：原始碼|併發一枝花之ConcurrentLinkedQueue【偽】
作者：猴子007
出處：monkeysayhi.github.io
本文基於知識共享署名-相同方式共享 4.0 國際許可協議釋出，歡迎轉載，演繹或用於商業目的，但是必須保留本文的署名及連結。

原始碼|併發一枝花之CopyOnWriteArrayList
2019-01-16
原始碼
原始碼|併發一枝花之BlockingQueue
2021-09-09
原始碼BloC
原始碼|併發一枝花之ReentrantLock與AQS（3）：Condition
2018-01-01
原始碼ReentrantLockAQS
併發程式設計之 ConcurrentLinkedQueue 原始碼剖析
2018-04-30
程式設計原始碼
Java併發包原始碼學習系列：基於CAS非阻塞併發佇列ConcurrentLinkedQueue原始碼解析
2021-02-06
Java原始碼佇列
java併發之ConcurrentLinkedQueue
2019-08-03
Java
併發佇列ConcurrentLinkedQueue與LinkedBlockingQueue原始碼分析與對比
2021-08-01
佇列BloC原始碼
集合-ConcurrentLinkedQueue 原始碼解析
2020-07-13
原始碼
【Interview】深入理解ConcurrentLinkedQueue原始碼
2019-03-29
View原始碼
ConcurrentLinkedQueue 原始碼分析 (基於Java 8)
2017-01-14
原始碼Java
併發程式設計ConcurrentLinkedQueue使用示例詳解
2023-01-31
程式設計
yield偽併發練習
2024-09-13
多執行緒高併發程式設計(11) -- 非阻塞演算法實現ConcurrentLinkedQueue原始碼分析
2020-06-17
執行緒程式設計演算法原始碼
死磕 java集合之ConcurrentLinkedQueue原始碼分析
2019-04-27
Java原始碼
java併發之hashmap原始碼
2019-05-26
JavaHashMap原始碼
併發類Condition原始碼分析
2020-12-06
原始碼
併發佇列ConcurrentLinkedQueue和阻塞佇列LinkedBlockingQueue用法
2015-12-03
佇列BloC
併發程式設計—— FutureTask 原始碼分析
2019-02-26
程式設計原始碼
Java併發之AQS原始碼分析（二）
2019-05-08
JavaAQS原始碼
Java併發之Semaphore原始碼解析（一）
2021-07-04
Java原始碼
Java併發之Semaphore原始碼解析（二）
2021-07-04
Java原始碼
併發工具類：Semaphore原始碼解讀
2018-05-18
原始碼
Java併發包原始碼學習系列：同步元件CountDownLatch原始碼解析
2021-02-20
Java原始碼元件CountDownLatch
Java併發包原始碼學習系列：同步元件CyclicBarrier原始碼解析
2021-02-20
Java原始碼元件
Java併發包原始碼學習系列：同步元件Semaphore原始碼解析
2021-02-21
Java原始碼元件
Java溯源防偽管理系統原始碼，一物一碼二維碼防偽追溯系統原始碼
2022-06-16
Java原始碼
併發系列（二）——FutureTask類原始碼簡析
2020-07-25
原始碼
併發程式設計之 Exchanger 原始碼分析
2019-03-04
程式設計原始碼
Java併發之ReentrantLock原始碼解析（一）
2021-06-29
JavaReentrantLock原始碼
Java併發之ReentrantLock原始碼解析（二）
2021-06-29
JavaReentrantLock原始碼
Java併發之ReentrantLock原始碼解析（三）
2021-06-30
JavaReentrantLock原始碼
Java併發之ReentrantLock原始碼解析（四）
2021-07-01
JavaReentrantLock原始碼
併發程式設計之：AQS原始碼解析
2021-09-04
程式設計AQS原始碼
Java併發之ThreadPoolExecutor原始碼解析（二）
2021-02-25
Javathread原始碼
Java併發之ThreadPoolExecutor原始碼解析（三）
2021-02-28
Javathread原始碼
java 併發程式設計-AQS原始碼分析
2018-10-27
Java程式設計AQS原始碼
併發程式設計之 CountDown 原始碼分析
2018-04-30
程式設計原始碼
併發程式設計之 CyclicBarrier 原始碼分析
2018-04-30
程式設計原始碼

原始碼|併發一枝花之ConcurrentLinkedQueue【偽】

準備知識：CAS

悲觀鎖與樂觀鎖

CAS

佇列的狀態機模型

佇列介面

狀態機定義

狀態集

狀態轉換集

自擼ConcurrentLinkedQueue

入隊方法offer()

思路1：讓同一個生產者P1連續完成兩個狀態轉換T1、T2，保證P2不會插入進來

思路2：生產者P1完成狀態轉換T1後，P2代勞完成狀態轉換T2

減少無效的競爭

出隊方法poll()

狀態機

程式碼

另一種狀態機

一個trick

其他特殊情況

case1：佇列空

case2：佇列長度等於1

小結

JDK實現

構造方法

入隊方法offer()

出隊方法poll()

未完

相關文章