JAVA 中的 CAS

犀利豆發表於2018-02-03

原文地址:www.xilidou.com/2018/02/01/…

CAS 是現代作業系統,解決併發問題的一個重要手段,最近在看 eureka 的原始碼的時候。遇到了很多 CAS 的操作。今天就係統的回顧一下 Java 中的CAS。

閱讀這篇文章你將會了解到:

  • 什麼是 CAS
  • CAS 實現原理是什麼?
  • CAS 在現實中的應用
    • 自旋鎖
    • 原子型別
    • 限流器
  • CAS 的缺點

什麼是 CAS

CAS: 全稱Compare and swap,字面意思:”比較並交換“,一個 CAS 涉及到以下操作:

我們假設記憶體中的原資料V,舊的預期值A,需要修改的新值B。

  1. 比較 A 與 V 是否相等。(比較)
  2. 如果比較相等,將 B 寫入 V。(交換)
  3. 返回操作是否成功。

當多個執行緒同時對某個資源進行CAS操作,只能有一個執行緒操作成功,但是並不會阻塞其他執行緒,其他執行緒只會收到操作失敗的訊號。可見 CAS 其實是一個樂觀鎖。

CAS 是怎麼實現的

跟隨AtomInteger的程式碼我們一路往下,就能發現最終呼叫的是 sum.misc.Unsafe 這個類。看名稱 Unsafe 就是一個不安全的類,這個類是利用了 Java 的類和包在可見性的的規則中的一個恰到好處處的漏洞。Unsafe 這個類為了速度,在Java的安全標準上做出了一定的妥協。

再往下尋找我們發現 Unsafe的compareAndSwapInt 是 Native 的方法:

public final native boolean compareAndSwapInt(Object var1, long var2, int var4, int var5);
複製程式碼

也就是說,這幾個 CAS 的方法應該是使用了本地的方法。所以這幾個方法的具體實現需要我們自己去 jdk 的原始碼中搜尋。

於是我下載一個 OpenJdk 的原始碼繼續向下探索,我們發現在 /jdk9u/hotspot/src/share/vm/unsafe.cpp 中有這樣的程式碼:

{CC "compareAndSetInt",   CC "(" OBJ "J""I""I"")Z",  FN_PTR(Unsafe_CompareAndSetInt)},
複製程式碼

這個涉及到,JNI 的呼叫,感興趣的同學可以自行學習。我們搜尋 Unsafe_CompareAndSetInt後發現:

UNSAFE_ENTRY(jboolean, Unsafe_CompareAndSetInt(JNIEnv *env, jobject unsafe, jobject obj, jlong offset, jint e, jint x)) {
  oop p = JNIHandles::resolve(obj);
  jint* addr = (jint *)index_oop_from_field_offset_long(p, offset);

  return (jint)(Atomic::cmpxchg(x, addr, e)) == e;
} UNSAFE_END
複製程式碼

最終我們終於看到了核心程式碼 Atomic::cmpxchg

繼續向底層探索,在檔案java/jdk9u/hotspot/src/os_cpu/linux_x86/vm/atomic_linux_x86.hpp有這樣的程式碼:

inline jint     Atomic::cmpxchg    (jint     exchange_value, volatile jint*     dest, jint     compare_value, cmpxchg_memory_order order) {
  int mp = os::is_MP();
  __asm__ volatile (LOCK_IF_MP(%4) "cmpxchgl %1,(%3)"
                    : "=a" (exchange_value)
                    : "r" (exchange_value), "a" (compare_value), "r" (dest), "r" (mp)
                    : "cc", "memory");
  return exchange_value;
}
複製程式碼

我們通過檔名可以知道,針對不同的作業系統,JVM 對於 Atomic::cmpxchg 應該有不同的實現。由於我們服務基本都是使用的是64位linux,所以我們就看看linux_x86 的實現。

我們繼續看程式碼:

  • __asm__ 的意思是這個是一段內嵌彙編程式碼。也就是在 C 語言中使用匯編程式碼。
  • 這裡的 volatile和 JAVA 有一點類似,但不是為了記憶體的可見性,而是告訴編譯器對訪問該變數的程式碼就不再進行優化。
  • LOCK_IF_MP(%4) 的意思就比較簡單,就是如果作業系統是多執行緒的,那就增加一個 LOCK。
  • cmpxchgl 就是彙編版的“比較並交換”。但是我們知道比較並交換,有三個步驟,不是原子的。所以在多核情況下加一個 LOCK,由CPU硬體保證他的原子性。
  • 我們再看看 LOCK 是怎麼實現的呢?我們去Intel的官網上看看,可以知道LOCK在的早期實現是直接將 cup 的匯流排阻塞,這樣的實現可見效率是很低下的。後來優化為X86 cpu 有鎖定一個特定記憶體地址的能力,當這個特定記憶體地址被鎖定後,它就可以阻止其他的系統匯流排讀取或修改這個記憶體地址。

關於 CAS 的底層探索我們就到此為止。我們總結一下 JAVA 的 cas 是怎麼實現的:

  • java 的 cas 利用的的是 unsafe 這個類提供的 cas 操作。
  • unsafe 的cas 依賴了的是 jvm 針對不同的作業系統實現的 Atomic::cmpxchg
  • Atomic::cmpxchg 的實現使用了彙編的 cas 操作,並使用 cpu 硬體提供的 lock訊號保證其原子性

CAS 的應用

瞭解了 CAS 的原理我們繼續就看看 CAS 的應用:

自旋鎖

public class SpinLock {

  private AtomicReference<Thread> sign =new AtomicReference<>();

  public void lock(){
    Thread current = Thread.currentThread();
    while(!sign .compareAndSet(null, current)){
    }
  }

  public void unlock (){
    Thread current = Thread.currentThread();
    sign .compareAndSet(current, null);
  }
}
複製程式碼

所謂自旋鎖,我覺得這個名字相當的形象,在lock()的時候,一直while()迴圈,直到 cas 操作成功為止。

AtomicInteger 的 incrementAndGet()

    public final int getAndAddInt(Object var1, long var2, int var4) {
        int var5;
        do {
            var5 = this.getIntVolatile(var1, var2);
        } while(!this.compareAndSwapInt(var1, var2, var5, var5 + var4));

        return var5;
    }
複製程式碼

與自旋鎖有異曲同工之妙,就是一直while,直到操作成功為止。

令牌桶限流器

所謂令牌桶限流器,就是系統以恆定的速度向桶內增加令牌。每次請求前從令牌桶裡面獲取令牌。如果獲取到令牌就才可以進行訪問。當令牌桶內沒有令牌的時候,拒絕提供服務。我們來看看 eureka 的限流器是如何使用 CAS 來維護多執行緒環境下對 token 的增加和分發的。

public class RateLimiter {

    private final long rateToMsConversion;

    private final AtomicInteger consumedTokens = new AtomicInteger();
    private final AtomicLong lastRefillTime = new AtomicLong(0);

    @Deprecated
    public RateLimiter() {
        this(TimeUnit.SECONDS);
    }

    public RateLimiter(TimeUnit averageRateUnit) {
        switch (averageRateUnit) {
            case SECONDS:
                rateToMsConversion = 1000;
                break;
            case MINUTES:
                rateToMsConversion = 60 * 1000;
                break;
            default:
                throw new IllegalArgumentException("TimeUnit of " + averageRateUnit + " is not supported");
        }
    }

    //提供給外界獲取 token 的方法
    public boolean acquire(int burstSize, long averageRate) {
        return acquire(burstSize, averageRate, System.currentTimeMillis());
    }

    public boolean acquire(int burstSize, long averageRate, long currentTimeMillis) {
        if (burstSize <= 0 || averageRate <= 0) { // Instead of throwing exception, we just let all the traffic go
            return true;
        }

        //新增token
        refillToken(burstSize, averageRate, currentTimeMillis);

        //消費token
        return consumeToken(burstSize);
    }

    private void refillToken(int burstSize, long averageRate, long currentTimeMillis) {
        long refillTime = lastRefillTime.get();
        long timeDelta = currentTimeMillis - refillTime;

        //根據頻率計算需要增加多少 token
        long newTokens = timeDelta * averageRate / rateToMsConversion;
        if (newTokens > 0) {
            long newRefillTime = refillTime == 0
                    ? currentTimeMillis
                    : refillTime + newTokens * rateToMsConversion / averageRate;

            // CAS 保證有且僅有一個執行緒進入填充
            if (lastRefillTime.compareAndSet(refillTime, newRefillTime)) {
                while (true) {
                    int currentLevel = consumedTokens.get();
                    int adjustedLevel = Math.min(currentLevel, burstSize); // In case burstSize decreased
                    int newLevel = (int) Math.max(0, adjustedLevel - newTokens);
                    // while true 直到更新成功為止
                    if (consumedTokens.compareAndSet(currentLevel, newLevel)) {
                        return;
                    }
                }
            }
        }
    }

    private boolean consumeToken(int burstSize) {
        while (true) {
            int currentLevel = consumedTokens.get();
            if (currentLevel >= burstSize) {
                return false;
            }

            // while true 直到沒有token 或者 獲取到為止
            if (consumedTokens.compareAndSet(currentLevel, currentLevel + 1)) {
                return true;
            }
        }
    }

    public void reset() {
        consumedTokens.set(0);
        lastRefillTime.set(0);
    }
}

複製程式碼

所以梳理一下 CAS 在令牌桶限流器的作用。就是保證在多執行緒情況下,不阻塞執行緒的填充token 和消費token。

歸納

通過上面的三個應用我們歸納一下 CAS 的應用場景:

  • CAS 的使用能夠避免執行緒的阻塞。
  • 多數情況下我們使用的是 while true 直到成功為止。

CAS 缺點

  1. ABA 的問題,就是一個值從A變成了B又變成了A,使用CAS操作不能發現這個值發生變化了,處理方式是可以使用攜帶類似時間戳的版本AtomicStampedReference
  2. 效能問題,我們使用時大部分時間使用的是 while true 方式對資料的修改,直到成功為止。優勢就是相應極快,但當執行緒數不停增加時,效能下降明顯,因為每個執行緒都需要執行,佔用CPU時間。

總結

CAS 是整個程式設計重要的思想之一。整個計算機的實現中都有CAS的身影。微觀上看彙編的 CAS 是實現作業系統級別的原子操作的基石。從程式語言角度來看 CAS 是實現多執行緒非阻塞操作的基石。巨集觀上看,在分散式系統中,我們可以使用 CAS 的思想利用類似Redis的外部儲存,也能實現一個分散式鎖。

從某個角度來說架構就將微觀的實現放大,或者底層思想就是將巨集觀的架構進行微縮。計算機的思想是想通的,所以說了解底層的實現可以提升架構能力,提升架構的能力同樣可加深對底層實現的理解。計算機知識浩如煙海,但是套路有限。抓住基礎的幾個套路突破,從思想和思維的角度學習計算機知識。不要將自己的精力花費在不停的追求新技術的腳步上,跟隨‘start guide line’只能寫一個demo,所得也就是一個demo而已。

停下腳步,回顧基礎和經典或許對於技術的提升更大一些。

希望這篇文章對大家有所幫助。

徒手擼框架系列文章地址:

徒手擼框架--高併發環境下的請求合併

徒手擼框架--實現IoC

徒手擼框架--實現Aop

歡迎關注我的微信公眾號

二維碼

相關文章