Java併發 -- Fork/Join框架

翻身碼農把歌唱發表於2018-07-25

文章基於jdk1.7,通過學習《Java併發程式設計的藝術》,對Fork/Join框架的理解。

什麼是Fork/Join框架

Fork/Join框架是Java7提供了的一個用於並行執行任務的框架, 是一個把大任務分割成若干個小任務,最終彙總每個小任務結果後得到大任務結果的框架。

它的主要思想是:分而治之。

工作竊取演算法

工作竊取(work-stealing)演算法是指某個執行緒從其他佇列裡竊取任務來執行。

什麼需要使用工作竊取演算法呢?假如我們需要做一個比較大的任務,我們可以把這個任務分割為若干互不依賴的子任務,為了減少執行緒間的競爭,於是把這些子任務分別放到不同的佇列裡,併為每個佇列建立一個單獨的執行緒來執行佇列裡的任務,執行緒和佇列一一對應,比如A執行緒負責處理A佇列裡的任務。但是有的執行緒會先把自己佇列裡的任務幹完,而其他執行緒對應的佇列裡還有任務等待處理。幹完活的執行緒與其等著,不如去幫其他執行緒幹活,於是它就去其他執行緒的佇列裡竊取一個任務來執行。而在這時它們會訪問同一個佇列,所以為了減少竊取任務執行緒和被竊取任務執行緒之間的競爭,通常會使用雙端佇列,被竊取任務執行緒永遠從雙端佇列的頭部拿任務執行,而竊取任務的執行緒永遠從雙端佇列的尾部拿任務執行。

工作竊取演算法的優點是充分利用執行緒進行平行計算,並減少了執行緒間的競爭,其缺點是在某些情況下還是存在競爭,比如雙端佇列裡只有一個任務時。並且消耗了更多的系統資源,比如建立多個執行緒和多個雙端佇列。

介紹

Fork/Join框架的設計分為兩步:

第一步分割任務。首先我們需要有一個fork類來把大任務分割成子任務,有可能子任務還是很大,所以還需要不停的分割,直到分割出的子任務足夠小。

第二步執行任務併合並結果。分割的子任務分別放在雙端佇列裡,然後幾個啟動執行緒分別從雙端佇列裡獲取任務執行。子任務執行完的結果都統一放在一個佇列裡,啟動一個執行緒從佇列裡拿資料,然後合併這些資料。

Fork/Join使用兩個類來完成以上兩件事情:

  • ForkJoinTask:我們要使用ForkJoin框架,必須首先建立一個ForkJoin任務。它提供在任務中執行fork()和join()操作的機制,通常情況下我們不需要直接繼承ForkJoinTask類,而只需要繼承它的子類,Fork/Join框架提供了以下兩個子類:

    RecursiveAction:用於沒有返回結果的任務。 RecursiveTask :用於有返回結果的任務。

  • ForkJoinPool :ForkJoinTask需要通過ForkJoinPool來執行,任務分割出的子任務會新增到當前工作執行緒所維護的雙端佇列中,進入佇列的頭部。當一個工作執行緒的佇列裡暫時沒有任務時,它會隨機從其他工作執行緒的佇列的尾部獲取一個任務。

使用

使用Fork/Join框架計算:1+2+3+……+100000000.

使用Fork/Join框架首先要考慮到的是如何分割任務,如果我們希望每個子任務最多執行10000個數的相加,那麼我們設定分割的閾值是10000,由於是100000000個數字相加,所以會不停的分割,第一次先分割成兩部分,即1~50000000 和 50000001~100000000,第二次繼續將 1~50000000 分割成 1~25000000 和 25000001~50000000 ,將50000001~100000000 分割成 50000001~75000000 和 75000001~100000000 ……,一直分割,直到 開始和 結束的的差小於等於10000。

import java.util.concurrent.*;
public class CountTask extends RecursiveTask<Long> {

    /**
     * 閥值
     */
    private static final long THRESHOLD = 10000;
    // 開始數
    private long start;
    // 結束數
    private long end;

    public CountTask(long start, long end) {
        this.start = start;
        this.end = end;
    }

    @Override
    protected Long compute() {
        long sum = 0;
        // 如果足夠小就計算
        boolean canComplute = (end - start) <= THRESHOLD;
        if(canComplute) {
            for(long i = start; i <= end; i++) {
                sum += i;
            }
        } else {  // 否則,對大任務進行拆分
            // 對半分
            long middle = (start + end) /2;
            // 進行遞迴
            CountTask left = new CountTask(start, middle);
            CountTask right = new CountTask(middle + 1, end);
            // 執行子任務
            invokeAll(left, right);
            // 獲取結果
            long lResult = left.join();
            long rRight = right.join();
            sum = lResult + rRight;
        }
        return sum;
    }

    public static void main(String[] args) {
        long s = System.currentTimeMillis();
        ForkJoinPool pool = ForkJoinPool.commonPool();
        CountTask countTask = new CountTask(1,100000000);   // 引數為起始值與結束值
        Future<Long> result = pool.submit(countTask);
        // 如果任務完成
        if(!((ForkJoinTask<Long>) result).isCompletedAbnormally()) {
            try {
                // 獲取任務結果
                System.out.println("fork/join計算為:" + result.get());
            } catch (InterruptedException e) {
                e.printStackTrace();
            } catch (ExecutionException e) {
                e.printStackTrace();
            }
        }
        System.out.println("fork/join計算花費時間:" + (System.currentTimeMillis() - s) + "ms");

        s = System.currentTimeMillis();
        long sum = 0;
        for(int i = 1; i <= 100000000 ; i++) {
            sum += i;
        }
        System.out.println("計算結果:" + sum);
        System.out.println("普通計算花費時間:" + (System.currentTimeMillis() - s) + "ms");
    }
}
複製程式碼

fork/join計算為:5000000050000000 fork/join計算花費時間:53ms 計算結果:5000000050000000 普通計算花費時間:55ms

三種提交任務到ForkJoinPool的方法:

  1. execute():非同步執行,沒有任何返回 。
  2. invoke():同步執行,呼叫之後需要等待任務完成,才能執行後面的程式碼 。
  3. submit():非同步執行,當呼叫get方法的時候會阻塞,完成時返回一個future物件用於檢查狀態以及執行結果。
ForkJoinPool commonPool = ForkJoinPool.commonPool(); 
複製程式碼

為公共池提供一個引用,使用預定義的公共池減少了資源消耗,因為這阻礙了每個任務建立一個單獨的執行緒池。

檢查任務執行的狀態

  • 無論以什麼方式結束任務,isDone() 方法返回true;
  • 如果完成任務過程中沒有被取消或者發生異常,isCompletedNormally() 方法返回true;
  • 如果任務被取消, isCancelled() 方法返回true;
  • 如果任務被取消或者遇到異常,isCompletedAbnormally() 方法返回true

異常處理

ForkJoinTask在執行的時候可能會丟擲異常,但是我們沒辦法在主執行緒裡直接捕獲異常,所以ForkJoinTask提供了isCompletedAbnormally()方法來檢查任務是否已經丟擲異常或已經被取消了,並且可以通過ForkJoinTask的getException方法獲取異常。使用如下程式碼:

if(task.isCompletedAbnormally()) {
    System.out.println(task.getException());
}
複製程式碼

getException方法返回Throwable物件,如果任務被取消了則返回CancellationException。如果任務沒有完成或者沒有丟擲異常則返回null。

與ExecutorService 的區別

Fork/Join採用“工作竊取模式”,當執行新的任務時他可以將其拆分成更小的任務執行,並將小任務加到執行緒佇列中,然後再從一個隨即執行緒中偷一個並把它加入自己的佇列中。

就比如兩個CPU上有不同的任務,這時候A已經執行完,B還有任務等待執行,這時候A就會將B隊尾的任務偷過來,加入自己的佇列中,對於傳統的執行緒,ForkJoin更有效的利用的CPU資源!

實現原理

ForkJoinPool由ForkJoinTask陣列和ForkJoinWorkerThread陣列組成,ForkJoinTask陣列負責存放程式提交給ForkJoinPool的任務,而ForkJoinWorkerThread陣列負責執行這些任務。

ForkJoinTask的fork方法實現原理。當我們呼叫ForkJoinTask的fork方法時,程式會呼叫ForkJoinWorkerThread的pushTask方法非同步的執行這個任務,然後立即返回結果。程式碼如下:

public final ForkJoinTask fork() {
        ((ForkJoinWorkerThread) Thread.currentThread())
            .pushTask(this);
        return this;
}
複製程式碼

pushTask方法把當前任務存放在ForkJoinTask 陣列queue裡。然後再呼叫ForkJoinPool的signalWork()方法喚醒或建立一個工作執行緒來執行任務。程式碼如下:

final void pushTask(ForkJoinTask t) {
        ForkJoinTask[] q; int s, m;
        if ((q = queue) != null) {    // ignore if queue removed
            long u = (((s = queueTop) & (m = q.length - 1)) << ASHIFT) + ABASE;
            UNSAFE.putOrderedObject(q, u, t);
            queueTop = s + 1;         // or use putOrderedInt
            if ((s -= queueBase) <= 2)
                pool.signalWork();
	else if (s == m)
                growQueue();
        }
    }
複製程式碼

首先,它呼叫了doJoin()方法,通過doJoin()方法得到當前任務的狀態來判斷返回什麼結果,任務狀態有四種:已完成(NORMAL),被取消(CANCELLED),訊號(SIGNAL)和出現異常(EXCEPTIONAL)。

  • 如果任務狀態是已完成,則直接返回任務結果。
  • 如果任務狀態是被取消,則直接丟擲CancellationException。
  • 如果任務狀態是丟擲異常,則直接丟擲對應的異常。

讓我們再來分析下doJoin()方法的實現程式碼:

private int doJoin() {
        Thread t; 
    	ForkJoinWorkerThread w; 
    	int s; 
    	boolean completed;
        if ((t = Thread.currentThread()) instanceof ForkJoinWorkerThread) {
            if ((s = status) < 0)
 				return s;
            if ((w = (ForkJoinWorkerThread)t).unpushTask(this)) {
                try {
                    completed = exec();
                } catch (Throwable rex) {
                    return setExceptionalCompletion(rex);
                }
                if (completed)
                    return setCompletion(NORMAL);
            }
            return w.joinTask(this);
        }
        else
            return externalAwaitDone();
    }
複製程式碼

在doJoin()方法裡,首先通過檢視任務的狀態,看任務是否已經執行完了,如果執行完了,則直接返回任務狀態,如果沒有執行完,則從任務陣列裡取出任務並執行。如果任務順利執行完成了,則設定任務狀態為NORMAL,如果出現異常,則紀錄異常,並將任務狀態設定為EXCEPTIONAL。

歡迎關注我的公眾號哦~ 搜尋公眾號:翻身碼農把歌唱 或者 掃描下方二維碼:

img

相關文章