高效能無鎖佇列 Disruptor 初體驗

haifeiWu發表於2018-08-16

原文地址: haifeiWu和他朋友們的部落格
部落格地址:www.hchstudio.cn
歡迎轉載,轉載請註明作者及出處,謝謝!

最近一直在研究佇列的一些問題,今天樓主要分享一個高效能的佇列 Disruptor 。

what Disruptor ?

它是英國外匯交易公司 LMAX 開發的一個高效能佇列,研發的初衷是解決記憶體佇列的延遲問題。基於 Disruptor 開發的系統單執行緒能支撐每秒600萬訂單。

目前,包括 Apache Storm、Log4j2 在內的很多知名專案都應用了Disruptor以獲取高效能。在樓主公司內部使用 Disruptor 與 Netty 結合用來做 GPS 實時資料的處理,效能相當強悍。本文從實戰角度來大概瞭解一下 Disruptor 的實現原理。

why Disruptor ?

Disruptor通過以下設計來解決佇列速度慢的問題:

  • 環形陣列結構 為了避免垃圾回收,採用陣列而非連結串列。因為,陣列對處理器的快取機制更加友好。
  • 元素位置定位 陣列長度2^n,通過位運算,加快定位的速度。下標採取遞增的形式。不用擔心index溢位的問題。index是long型別,即使100萬QPS的處理速度,也需要30萬年才能用完。
  • 無鎖設計 每個生產者或者消費者執行緒,會先申請可以操作的元素在陣列中的位置,申請到之後,直接在該位置寫入或者讀取資料。
  • 針對偽共享問題的優化 Disruptor 消除這個問題,至少對於快取行大小是64位元組或更少的處理器架構來說是這樣的(有可能處理器的快取行是128位元組,那麼使用64位元組填充還是會存在偽共享問題),通過增加補全來確保ring buffer的序列號不會和其他東西同時存在於一個快取行中。

how Disruptor ?

通過上面的介紹,我們大概可以瞭解到 Disruptor 是一個高效能的無鎖佇列,那麼該如何使用呢,下面樓主通過 Disruptor 實現一個簡單的生產者消費者模型,介紹 Disruptor 的使用

首先,根據 Disruptor 的事件驅動的程式設計模型,我們需要定義一個事件來攜帶資料。


public class DataEvent {
    private long value;

    public void set(long value) {
        this.value = value;
    }

    public long getValue() {
        return value;
    }
}

複製程式碼

為了讓 Disruptor 為我們預先分配這些事件,我們需要構造一個 EventFactory 來執行構造


public class DataEventFactory implements EventFactory<DataEvent> {

    @Override
    public DataEvent newInstance() {
        return new DataEvent();
    }
}

複製程式碼

一旦我們定義了事件,我們需要建立一個處理這些事件的消費者。 在我們的例子中,我們要做的就是從控制檯中列印出值。

public class DataEventHandler implements EventHandler<DataEvent> {
    @Override
    public void onEvent(DataEvent dataEvent, long l, boolean b) throws Exception {
        new DataEventConsumer(dataEvent);
    }
}
複製程式碼

接下來我們需要初始化 Disruptor ,並定義一個生產者來生成訊息


public class DisruptorManager {

    private final static Logger LOG = LoggerFactory.getLogger(DisruptorManager.class);

    /*消費者執行緒池*/
    private static ExecutorService threadPool;
    private static Disruptor<DataEvent> disruptor;
    private static RingBuffer<DataEvent> ringBuffer;

    private static AtomicLong dataNum = new AtomicLong();

    public static void init(EventHandler<DataEvent> eventHandler) {

        //初始化disruptor
        threadPool = Executors.newCachedThreadPool();
        disruptor = new Disruptor<>(new DataEventFactory(), 8 * 1024, threadPool, ProducerType.MULTI, new BlockingWaitStrategy());

        ringBuffer = disruptor.getRingBuffer();
        disruptor.handleEventsWith(eventHandler);
        disruptor.start();

        new Timer().schedule(new TimerTask() {
            @Override
            public void run() {
                LOG.info("放入佇列中資料編號{},佇列剩餘空間{}", dataNum.get(), ringBuffer.remainingCapacity());
            }
        }, new Date(), 60 * 1000);
    }

    /**
     *
     * @param message
     */
    public static void putDataToQueue(long message) {
        if (dataNum.get() == Long.MAX_VALUE) {
            dataNum.set(0L);
        }

        // 往佇列中加事件
        long next = ringBuffer.next();
        try {
            ringBuffer.get(next).set(message);
            dataNum.incrementAndGet();
        } catch (Exception e) {
            LOG.error("向RingBuffer存入資料[{}]出現異常=>{}", message, e.getStackTrace());
        } finally {
            ringBuffer.publish(next);
        }
    }

    public static void close() {
        threadPool.shutdown();
        disruptor.shutdown();
    }
}

複製程式碼

最後我們來定義一個 Main 方法來執行程式碼


public class EventMain {

    public static void main(String[] args) throws Exception {
        DisruptorManager.init(new DataEventHandler());
        for (long l = 0; true; l++) {
            DisruptorManager.putDataToQueue(l);
            Thread.sleep(1000);
        }
    }
}

複製程式碼

上面程式碼具體感興趣的小夥伴請移步 github.com/haifeiWu/di…

然後我們可以看到控制檯列印出來的資料

console

小結

Disruptor 通過精巧的無鎖設計實現了在高併發情形下的高效能。

另外在Log4j 2中的非同步模式採用了Disruptor來處理。在這裡樓主遇到一個小問題,就是在使用Log4j 2通過 TCP 模式往 logstash 發日誌資料的時候,由於網路問題導致連結中斷,從而導致 Log4j 2 不停的往 ringbuffer 中寫資料,ringbuffer資料沒有消費者,導致伺服器記憶體跑滿。解決方案是設定 Log4j 2 中 Disruptor 佇列有界,或者換成 UDP 模式來寫日誌資料(如果資料不重要的話)。

參考連結

相關文章