Fork/Join框架
什麼是Fork/Join框架
Fork/Join框架是Java7提供了的一個用於並行執行任務的框架, 是一個把大任務分割成若干個小任務,最終彙總每個小任務結果後得到大任務結果的框架。
我們再通過Fork和Join這兩個單詞來理解下Fork/Join框架,Fork就是把一個大任務切分為若干子任務並行的執行,Join就是合併這些子任務的執行結果,最後得到這個大任務的結果。比如計算1+2+。。+10000,可以分割成10個子任務,每個子任務分別對1000個數進行求和,最終彙總這10個子任務的結果。Fork/Join的執行流程圖如下:
工作竊取演算法
工作竊取(work-stealing)演算法是指某個執行緒從其他佇列裡竊取任務來執行。工作竊取的執行流程圖如下:
那麼為什麼需要使用工作竊取演算法呢?假如我們需要做一個比較大的任務,我們可以把這個任務分割為若干互不依賴的子任務,為了減少執行緒間的競爭,於是把這些子任務分別放到不同的佇列裡,併為每個佇列建立一個單獨的執行緒來執行佇列裡的任務,執行緒和佇列一一對應,比如A執行緒負責處理A佇列裡的任務。但是有的執行緒會先把自己佇列裡的任務幹完,而其他執行緒對應的佇列裡還有任務等待處理。幹完活的執行緒與其等著,不如去幫其他執行緒幹活,於是它就去其他執行緒的佇列裡竊取一個任務來執行。而在這時它們會訪問同一個佇列,所以為了減少竊取任務執行緒和被竊取任務執行緒之間的競爭,通常會使用雙端佇列,被竊取任務執行緒永遠從雙端佇列的頭部拿任務執行,而竊取任務的執行緒永遠從雙端佇列的尾部拿任務執行。
工作竊取演算法的優點是充分利用執行緒進行平行計算,並減少了執行緒間的競爭,其缺點是在某些情況下還是存在競爭,比如雙端佇列裡只有一個任務時。並且消耗了更多的系統資源,比如建立多個執行緒和多個雙端佇列。
3. Fork/Join框架的介紹
我們已經很清楚Fork/Join框架的需求了,那麼我們可以思考一下,如果讓我們來設計一個Fork/Join框架,該如何設計?這個思考有助於你理解Fork/Join框架的設計。
第一步分割任務。首先我們需要有一個fork類來把大任務分割成子任務,有可能子任務還是很大,所以還需要不停的分割,直到分割出的子任務足夠小。
第二步執行任務併合並結果。分割的子任務分別放在雙端佇列裡,然後幾個啟動執行緒分別從雙端佇列裡獲取任務執行。子任務執行完的結果都統一放在一個佇列裡,啟動一個執行緒從佇列裡拿資料,然後合併這些資料。
Fork/Join使用兩個類來完成以上兩件事情:
ForkJoinTask:我們要使用ForkJoin框架,必須首先建立一個ForkJoin任務。它提供在任務中執行fork()和join()操作的機制,通常情況下我們不需要直接繼承ForkJoinTask類,而只需要繼承它的子類,Fork/Join框架提供了以下兩個子類:
RecursiveAction:用於沒有返回結果的任務。
RecursiveTask :用於有返回結果的任務。
ForkJoinPool :ForkJoinTask需要通過ForkJoinPool來執行,任務分割出的子任務會新增到當前工作執行緒所維護的雙端佇列中,進入佇列的頭部。當一個工作執行緒的佇列裡暫時沒有任務時,它會隨機從其他工作執行緒的佇列的尾部獲取一個任務。
4. 使用Fork/Join框架
讓我們通過一個簡單的需求來使用下Fork/Join框架,需求是:計算1+2+3+4的結果。
使用Fork/Join框架首先要考慮到的是如何分割任務,如果我們希望每個子任務最多執行兩個數的相加,那麼我們設定分割的閾值是2,由於是4個數字相加,所以Fork/Join框架會把這個任務fork成兩個子任務,子任務一負責計算1+2,子任務二負責計算3+4,然後再join兩個子任務的結果。
因為是有結果的任務,所以必須繼承RecursiveTask,實現程式碼如下:
{
//RecursiveAction:用於沒有返回結果的任務。
//RecursiveTask :用於有返回結果的任務。
//閾值
private static final int THRESHOLD = 2;
private int start;
private int end;
public ForkAndJoindemo(int start, int end) {
this.start = start;
this.end = end;
}
protected Integer compute() {
int sum = 0;
boolean canCompute = (end-start)<=THRESHOLD;
if(canCompute){
System.out.println("start:"+start+" end:"+end);
for (int i=start;i<=end;i++){
sum+=i;
}
}else{
//如果任務多 就分裂多個子任務
int middle = (end+start)/2;
ForkAndJoindemo fork1 = new ForkAndJoindemo(start,middle);
ForkAndJoindemo fork2 = new ForkAndJoindemo(middle+1,end);
//執行子任務
fork1.fork();
fork2.fork();
//等待子任務完成彙總
int result1 = fork1.join();
int result2 = fork2.join();
sum = result1+result2;
}
return sum;
}
public static void main(String[] args) {
ForkJoinPool forkJoinPool = new ForkJoinPool();
ForkAndJoindemo task = new ForkAndJoindemo(1,100);
Future result = forkJoinPool.submit(task);
if(task.isCompletedAbnormally())
{
System.out.println(task.getException());
}
try {
System.out.println("結果:"+result.get());
} catch (InterruptedException e) {
e.printStackTrace();
} catch (ExecutionException e) {
e.printStackTrace();
}
}
}
" data-snippet-id="ext.298e38f9ae3d32493229c2ff1e2de5e7" data-snippet-saved="false" data-codota-status="done">package com.sun.jojo.forkandjoin;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.Future;
import java.util.concurrent.RecursiveTask;
/**
* Author sunjiamin
* Date 2017/8/1 16:18
* Describe :
*/
public class ForkAndJoindemo extends RecursiveTask<Integer> {
//RecursiveAction:用於沒有返回結果的任務。
//RecursiveTask :用於有返回結果的任務。
//閾值
private static final int THRESHOLD = 2;
private int start;
private int end;
public ForkAndJoindemo(int start, int end) {
this.start = start;
this.end = end;
}
protected Integer compute() {
int sum = 0;
boolean canCompute = (end-start)<=THRESHOLD;
if(canCompute){
System.out.println("start:"+start+" end:"+end);
for (int i=start;i<=end;i++){
sum+=i;
}
}else{
//如果任務多 就分裂多個子任務
int middle = (end+start)/2;
ForkAndJoindemo fork1 = new ForkAndJoindemo(start,middle);
ForkAndJoindemo fork2 = new ForkAndJoindemo(middle+1,end);
//執行子任務
fork1.fork();
fork2.fork();
//等待子任務完成彙總
int result1 = fork1.join();
int result2 = fork2.join();
sum = result1+result2;
}
return sum;
}
public static void main(String[] args) {
ForkJoinPool forkJoinPool = new ForkJoinPool();
ForkAndJoindemo task = new ForkAndJoindemo(1,100);
Future<Integer> result = forkJoinPool.submit(task);
if(task.isCompletedAbnormally())
{
System.out.println(task.getException());
}
try {
System.out.println("結果:"+result.get());
} catch (InterruptedException e) {
e.printStackTrace();
} catch (ExecutionException e) {
e.printStackTrace();
}
}
}
通過這個例子讓我們再來進一步瞭解ForkJoinTask,ForkJoinTask與一般的任務的主要區別在於它需要實現compute方法,在這個方法裡,首先需要判斷任務是否足夠小,如果足夠小就直接執行任務。如果不足夠小,就必須分割成兩個子任務,每個子任務在呼叫fork方法時,又會進入compute方法,看看當前子任務是否需要繼續分割成孫任務,如果不需要繼續分割,則執行當前子任務並返回結果。使用join方法會等待子任務執行完並得到其結果。
5. Fork/Join框架的異常處理
ForkJoinTask在執行的時候可能會丟擲異常,但是我們沒辦法在主執行緒裡直接捕獲異常,所以ForkJoinTask提供了isCompletedAbnormally()方法來檢查任務是否已經丟擲異常或已經被取消了,並且可以通過ForkJoinTask的getException方法獲取異常。使用如下程式碼:
if ( task.isCompletedAbnormally() )
{
System.out.println( task.getException() );
}
getException方法返回Throwable物件,如果任務被取消了則返回CancellationException。如果任務沒有完成或者沒有丟擲異常則返回null。
6. Fork/Join框架的實現原理
ForkJoinPool由ForkJoinTask陣列和ForkJoinWorkerThread陣列組成,ForkJoinTask陣列負責存放程式提交給ForkJoinPool的任務,而ForkJoinWorkerThread陣列負責執行這些任務。
ForkJoinTask的fork方法實現原理。當我們呼叫ForkJoinTask的fork方法時,程式會呼叫ForkJoinWorkerThread的pushTask方法非同步的執行這個任務,然後立即返回結果。程式碼如下:
public final ForkJoinTask fork()
{
( (ForkJoinWorkerThread) Thread.currentThread() ).pushTask( this ); return(this);
}
pushTask方法把當前任務存放在ForkJoinTask 陣列queue裡。然後再呼叫ForkJoinPool的signalWork()方法喚醒或建立一個工作執行緒來執行任務。程式碼如下:
final void pushTask(ForkJoinTask t) {
ForkJoinTask[] q; int s, m;
if ((q = queue) != null) { // ignore if queue removed
long u = (((s = queueTop) & (m = q.length - 1)) << ASHIFT) + ABASE;
UNSAFE.putOrderedObject(q, u, t);
queueTop = s + 1; // or use putOrderedInt
if ((s -= queueBase) <= 2)
pool.signalWork();
else if (s == m)
growQueue();
}
}
ForkJoinTask的join方法實現原理。Join方法的主要作用是阻塞當前執行緒並等待獲取結果。讓我們一起看看ForkJoinTask的join方法的實現,程式碼如下:
public final V join()
{
if ( doJoin() != NORMAL )
return(reportResult() );
else return(getRawResult() );
}
private V reportResult()
{
int s; Throwable ex; if ( (s = status) == CANCELLED )
throw new CancellationException();
if ( s == EXCEPTIONAL && (ex = getThrowableException() ) != null )
UNSAFE.throwException( ex );
return(getRawResult() );
}
首先,它呼叫了doJoin()方法,通過doJoin()方法得到當前任務的狀態來判斷返回什麼結果,任務狀態有四種:已完成(NORMAL),被取消(CANCELLED),訊號(SIGNAL)和出現異常(EXCEPTIONAL)。
如果任務狀態是已完成,則直接返回任務結果。
如果任務狀態是被取消,則直接丟擲CancellationException。
如果任務狀態是丟擲異常,則直接丟擲對應的異常。
讓我們再來分析下doJoin()方法的實現程式碼:
private int doJoin() {
Thread t; ForkJoinWorkerThread w; int s; boolean completed;
if ((t = Thread.currentThread()) instanceof ForkJoinWorkerThread) {
if ((s = status) < 0)
return s;
if ((w = (ForkJoinWorkerThread)t).unpushTask(this)) {
try {
completed = exec();
} catch (Throwable rex) {
return setExceptionalCompletion(rex);
}
if (completed)
return setCompletion(NORMAL);
}
return w.joinTask(this);
}
else
return externalAwaitDone();
}
在doJoin()方法裡,首先通過檢視任務的狀態,看任務是否已經執行完了,如果執行完了,則直接返回任務狀態,如果沒有執行完,則從任務陣列裡取出任務並執行。如果任務順利執行完成了,則設定任務狀態為NORMAL,如果出現異常,則紀錄異常,並將任務狀態設定為EXCEPTIONAL。
相關文章
- Fork/Join 框架框架
- Java Fork/Join 框架Java框架
- JUC之Fork/Join框架框架
- Java併發 -- Fork/Join框架Java框架
- Fork Join 併發任務執行框架框架
- Java併發6:阻塞佇列,Fork/Join框架Java佇列框架
- Java7提供的並行執行任務框架:Fork、Join框架Java並行框架
- java多執行緒8:阻塞佇列與Fork/Join框架Java執行緒佇列框架
- Java併發程式設計(07):Fork/Join框架機制詳解Java程式設計框架
- 談談fork/join實現原理
- 面試官:說說你對Fork/Join的平行計算框架的瞭解?面試框架
- MapReduce框架-Join的使用框架
- Java併發基礎-Fork、Join方式的平行計算研究分析Java
- ☕【Java技術指南】「併發程式設計專題」Fork/Join框架基本使用和原理探究(原理及原始碼篇)Java程式設計框架原始碼
- 多執行緒高併發程式設計(8) -- Fork/Join原始碼分析執行緒程式設計原始碼
- join、inner join、left join、right join、outer join的區別
- php的lavarel框架中join和orWhere的用法PHP框架
- MySQL LEFT JOIN/ INNER JOIN/RIGHT JOINMySql
- Fork倉庫
- Mysql join 的本質,Nested Loop Join 和 Hash JoinMySqlOOP
- mysql left join轉inner joinMySql
- .join()
- LEFT JOIN 和JOIN 多表連線
- sql:left join和join區別SQL
- sql的left join 、right join 、inner join之間的區別SQL
- mysql中的left join、right join 、inner join的詳細用法MySql
- 【Git】fork遠端倉庫,fork倉庫同步和提交pull requestGit
- 數倉工具—Hive語法之map join、reduce join、smb join(8)Hive
- git fork後如何更新Git
- 1.5.1 Python程式使用 -- forkPython
- fork()與vfork()函式函式
- fork failed - Cannot allocate memoryAI
- Linux fork程式的用法Linux
- fork和殭屍程式
- github同步fork倉庫Github
- JavaScript join()JavaScript
- Thread jointhread
- Git客戶端:Fork for MacGit客戶端Mac