比AtomicLong更高效的併發計數類LongAdder

chenjin666發表於2019-04-06

最近在看(輕量級的流量控制、熔斷降級 Java 庫)原始碼的時候,看到在統計數量的時候使用了LongAdder。這個LongAdder是jdk1.8新增的,出自Doug Lea之手,偉大的Java併發大師的鼻祖。在沒有接觸到LongAdder之前,AtomicLong這個類在併發計數上無論效能還是準確性已經做得極好了。在阿里流控框架中使用這樣一個LongAdder類,必然有其過人之處。


回顧AtomicLong

AtomicLong是透過CAS(即Compare And Swap)原理來完成原子遞增遞減操作,在併發情況下不會出現執行緒不安全結果。AtomicLong中的value是使用volatile修飾,併發下各個執行緒對value最新值均可見。我們以incrementAndGet()方法來深入。


  public final long incrementAndGet() {

        return unsafe.getAndAddLong(this, valueOffset, 1L) + 1L;

    }

1

2

3

這裡是呼叫了unsafe的方法


    public final long getAndAddLong(Object var1, long var2, long var4) {

        long var6;

        do {

            var6 = this.getLongVolatile(var1, var2);

        } while(!this.compareAndSwapLong(var1, var2, var6, var6 + var4));


        return var6;

    }

1

2

3

4

5

6

7

8

方法中this.compareAndSwapLong()有4個引數,var1是需要修改的類物件,var2是需要修改的欄位的記憶體地址,var6是修改前欄位的值,var6+var4是修改後欄位的值。compareAndSwapLong只有該欄位實際值和var6值相當的時候,才可以成功設定其為var6+var4。




再繼續往深一層去看


public final native boolean compareAndSwapLong(Object var1, long var2, long var4, long var6);

1

這裡Unsafe.compareAndSwapLong是native方法,底層透過JNI(Java Native Interface)來完成呼叫,實際就是藉助C來呼叫CPU指令來完成。


實現中使用了do-while迴圈,如果CAS失敗,則會繼續重試,直到成功為止。併發特別高的時候,雖然這裡可能會有很多次迴圈,但是還是可以保證執行緒安全的。不過如果自旋CAS操作長時間不成功,競爭較大,會帶CPU帶來極大的開銷,佔用更多的執行資源,可能會影響其他主業務的計算等。


LongAdder怎麼最佳化AtomicLong

Doug Lea在jdk1.5的時候就針對HashMap進行了執行緒安全和併發效能的最佳化,推出了分段鎖實現的ConcurrentHashMap。一般Java面試,基本上離不開ConcurrentHashMap這個網紅問題。另外在ForkJoinPool中,Doug Lea在其工作竊取演算法上對WorkQueue使用了細粒度鎖來較少併發的競爭,更多細節可參考我的原創文章ForkJoin使用和原理剖析。如果已經對ConcurrentHashMap有了較為深刻的理解,那麼現在來看LongAdder的實現就會相對簡單了。


來看LongAdder的increase()方法實現,


    public void add(long x) {

        Cell[] as; long b, v; int m; Cell a;

        //第一個if進行了兩個判斷,(1)如果cells不為空,則直接進入第二個if語句中。(2)同樣會先使用cas指令來嘗試add,如果成功則直接返回。如果失敗則說明存在競爭,需要重新add

        if ((as = cells) != null || !casBase(b = base, b + x)) {

            boolean uncontended = true;

            if (as == null || (m = as.length - 1) < 0 ||

                (a = as[getProbe() & m]) == null ||

                !(uncontended = a.cas(v = a.value, v + x)))

                longAccumulate(x, null, uncontended);

        }

    }

1

2

3

4

5

6

7

8

9

10

11

這裡用到了Cell類物件,Cell物件是LongAdder高併發實現的關鍵。在casBase衝突嚴重的時候,就會去建立Cell物件並新增到cells中,下面會詳細分析。


    @sun.misc.Contended static final class Cell {

        volatile long value;

        Cell(long x) { value = x; }

        //提供CAS方法修改當前Cell物件上的value

        final boolean cas(long cmp, long val) {

            return UNSAFE.compareAndSwapLong(this, valueOffset, cmp, val);

        }


        // Unsafe mechanics

        private static final sun.misc.Unsafe UNSAFE;

        private static final long valueOffset;

        static {

            try {

                UNSAFE = sun.misc.Unsafe.getUnsafe();

                Class<?> ak = Cell.class;

                valueOffset = UNSAFE.objectFieldOffset

                    (ak.getDeclaredField("value"));

            } catch (Exception e) {

                throw new Error(e);

            }

        }

    }

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

而這一句a = as[getProbe() & m]其實就是透過getProbe()拿到當前Thread的threadLocalRandomProbe的probe Hash值。這個值其實是一個隨機值,這個隨機值由當前執行緒ThreadLocalRandom.current()產生。不用Rondom的原因是因為這裡已經是高併發了,多執行緒情況下Rondom會極大可能得到同一個隨機值。因此這裡使用threadLocalRandomProbe在高併發時會更加隨機,減少衝突。更多ThreadLocalRandom資訊想要深入瞭解可關注這篇文章併發包中ThreadLocalRandom類原理淺嘗。拿到as陣列中當前執行緒的Cell物件,然後再進行CAS的更新操作,我們在原始碼上進行分析。longAccumulate()是在父類Striped64.java中。





    final void longAccumulate(long x, LongBinaryOperator fn,

                              boolean wasUncontended) {

        int h;

        if ((h = getProbe()) == 0) {

          //如果當前執行緒的隨機數為0,則初始化隨機數

            ThreadLocalRandom.current(); // force initialization

            h = getProbe();

            wasUncontended = true;

        }

        boolean collide = false;                // True if last slot nonempty

        for (;;) {

            Cell[] as; Cell a; int n; long v;

            //如果當前cells陣列不為空

            if ((as = cells) != null && (n = as.length) > 0) {

            //如果執行緒隨機數對應的cells對應陣列下標的Cell元素不為空,

                if ((a = as[(n - 1) & h]) == null) {

                //當使用到LongAdder的Cell陣列相關的操作時,需要先獲取全域性的cellsBusy的鎖,才可以進行相關操作。如果當前有其他執行緒的使用,則放棄這一步,繼續for迴圈重試。

                    if (cellsBusy == 0) {       // Try to attach new Cell

                    //Cell的初始值是x,建立完畢則說明已經加上

                        Cell r = new Cell(x);   // Optimistically create

                        //casCellsBusy獲取鎖,cellsBusy透過CAS方式獲取鎖,當成功設定cellsBusy為1時,則獲取到鎖。

                        if (cellsBusy == 0 && casCellsBusy()) {

                            boolean created = false;

                            try {               // Recheck under lock

                                Cell[] rs; int m, j;

                                if ((rs = cells) != null &&

                                    (m = rs.length) > 0 &&

                                    rs[j = (m - 1) & h] == null) {

                                    rs[j] = r;

                                    created = true;

                                }

                            } finally {

                              //finally裡面釋放鎖

                                cellsBusy = 0;

                            }

                            if (created)

                                break;

                            continue;           // Slot is now non-empty

                        }

                    }

                    collide = false;

                }

                else if (!wasUncontended)       // CAS already known to fail

                    wasUncontended = true;      // Continue after rehash

                //如果a不為空,則對a進行cas增x操作,成功則返回    

                else if (a.cas(v = a.value, ((fn == null) ? v + x :

                                             fn.applyAsLong(v, x))))

                    break;

                //cells的長度n已經大於CPU數量,則繼續擴容沒有意義,因此直接標記為不衝突

                else if (n >= NCPU || cells != as)

                    collide = false;            // At max size or stale

                else if (!collide)

                    collide = true;

                //到這一步則說明a不為空但是a上進行CAS操作也有多個執行緒在競爭,因此需要擴容cells陣列,其長度為原長度的2倍

                else if (cellsBusy == 0 && casCellsBusy()) {

                    try {

                        if (cells == as) {      // Expand table unless stale

                            Cell[] rs = new Cell[n << 1];

                            for (int i = 0; i < n; ++i)

                                rs[i] = as[i];

                            cells = rs;

                        }

                    } finally {

                        cellsBusy = 0;

                    }

                    collide = false;

                    continue;                   // Retry with expanded table

                }

                //繼續使用新的隨機數,避免在同一個Cell上競爭

                h = advanceProbe(h);

            }

            //如果cells為空,則需要先建立Cell陣列。初始長度為2.(個人理解這個if放在前面會比較好一點,哈哈)

            else if (cellsBusy == 0 && cells == as && casCellsBusy()) {

                boolean init = false;

                try {                           // Initialize table

                    if (cells == as) {

                        Cell[] rs = new Cell[2];

                        rs[h & 1] = new Cell(x);

                        cells = rs;

                        init = true;

                    }

                } finally {

                    cellsBusy = 0;

                }

                if (init)

                    break;

            }

            //如果在a上競爭失敗,且擴容競爭也失敗了,則在casBase上嘗試增加數量

            else if (casBase(v = base, ((fn == null) ? v + x :

                                        fn.applyAsLong(v, x))))

                break;                          // Fall back on using base

        }

    }

    

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

最後是求LongAdder的總數,這一步就非常簡單了,把base的值和所有cells上的value值加起來就是總數了。


    public long sum() {

        Cell[] as = cells; Cell a;

        long sum = base;

        if (as != null) {

            for (int i = 0; i < as.length; ++i) {

                if ((a = as[i]) != null)

                    sum += a.value;

            }

        }

        return sum;

    }

1

2

3

4

5

6

7

8

9

10

11

思考

原始碼中Cell陣列的會控制在不超過NCPU的兩倍,原因是LongAdder其實在底層是依賴CPU的CAS指令來操作,如果多出太多,即使在程式碼層面沒有競爭,在底層CPU的競爭會更多,所以這裡會有一個數量的限制。所以在LongAdder的設計中,由於使用到CAS指令操作,瓶頸在於CPU上。


YY一下,那麼有沒有方式可以突破這個瓶頸呢?我個人覺得是有的,但是有前提條件,應用場景極其有限。基於ThreadLocal的設計,假設統計只在一個固定的執行緒池中進行,假設執行緒池中的執行緒不會銷燬(異常補充執行緒的就暫時不管了),則可以認為執行緒數量是固定且不變的,那麼統計則可以依賴於只在當前執行緒中進行,那麼即使是高併發,就轉化為ThreadLocal這種單執行緒操作了,完全可以擺脫CAS的CPU指令操作的限制,那麼效能將極大提升。

 



總結

在併發處理上,AtomicLong和LongAdder均具有各自優勢,需要怎麼使用還是得看使用場景。看完這篇文章,其實並不意味著LongAdder就一定比AtomicLong好使,個人認為在QPS統計等統計操作上,LongAdder會更加適合,而AtomicLong在自增控制方面是LongAdder無法代替的。在多數地併發和少數高併發情況下,AtomicLong和LongAdder效能上差異並不是很大,只有在併發極高的時候,才能真正體現LongAdder的優勢。

--------------------- 

作者:codingtu 

來源:CSDN 

原文:https://blog.csdn.net/codingtu/article/details/89047291 

版權宣告:本文為博主原創文章,轉載請附上博文連結!


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31554889/viewspace-2640528/,如需轉載,請註明出處,否則將追究法律責任。

相關文章