Java執行緒(十一):Fork/Join-Java平行計算框架
平行計算在處處都有大資料的今天已經不是一個新鮮的詞彙了,現在已經有單機多核甚至多機叢集平行計算,注意,這裡說的是並行,而不是併發。嚴格的將,並行是指系統內有多個任務同時執行,而併發是指系統內有多個任務同時存在,不同的任務按時間分片的方式切換執行,由於切換的時間很短,給人的感覺好像是在同時執行。
Java在JDK7之後加入了平行計算的框架Fork/Join,可以解決我們系統中大資料計算的效能問題。Fork/Join採用的是分治法,Fork是將一個大任務拆分成若干個子任務,子任務分別去計算,而Join是獲取到子任務的計算結果,然後合併,這個是遞迴的過程。子任務被分配到不同的核上執行時,效率最高。虛擬碼如下:
Result solve(Problem problem) {
if (problem is small)
directly solve problem
else {
split problem into independent parts
fork new subtasks to solve each part
join all subtasks
compose result from subresults
}
}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
Fork/Join框架的核心類是ForkJoinPool,它能夠接收一個ForkJoinTask,並得到計算結果。ForkJoinTask有兩個子類,RecursiveTask(有返回值)和RecursiveAction(無返回結果),我們自己定義任務時,只需選擇這兩個類繼承即可。類圖如下:
下面來看一個例項:計算一個超大陣列所有元素的和。程式碼如下:
import java.util.Arrays;
import java.util.Random;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.RecursiveTask;
/**
* @author: shuang.gao Date: 2015/7/14 Time: 8:16
*/
public class SumTask extends RecursiveTask<Integer> {
private static final long serialVersionUID = -6196480027075657316L;
private static final int THRESHOLD = 500000;
private long[] array;
private int low;
private int high;
public SumTask(long[] array, int low, int high) {
this.array = array;
this.low = low;
this.high = high;
}
@Override
protected Integer compute() {
int sum = 0;
if (high - low <= THRESHOLD) {
// 小於閾值則直接計算
for (int i = low; i < high; i++) {
sum += array[i];
}
} else {
// 1. 一個大任務分割成兩個子任務
int mid = (low + high) >>> 1;
SumTask left = new SumTask(array, low, mid);
SumTask right = new SumTask(array, mid + 1, high);
// 2. 分別計算
left.fork();
right.fork();
// 3. 合併結果
sum = left.join() + right.join();
}
return sum;
}
public static void main(String[] args) throws ExecutionException, InterruptedException {
long[] array = genArray(1000000);
System.out.println(Arrays.toString(array));
// 1. 建立任務
SumTask sumTask = new SumTask(array, 0, array.length - 1);
long begin = System.currentTimeMillis();
// 2. 建立執行緒池
ForkJoinPool forkJoinPool = new ForkJoinPool();
// 3. 提交任務到執行緒池
forkJoinPool.submit(sumTask);
// 4. 獲取結果
Integer result = sumTask.get();
long end = System.currentTimeMillis();
System.out.println(String.format("結果 %s 耗時 %sms", result, end - begin));
}
private static long[] genArray(int size) {
long[] array = new long[size];
for (int i = 0; i < size; i++) {
array[i] = new Random().nextLong();
}
return array;
}
}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
我們通過調整閾值(THRESHOLD),可以發現耗時是不一樣的。實際應用中,如果需要分割的任務大小是固定的,可以經過測試,得到最佳閾值;如果大小不是固定的,就需要設計一個可伸縮的演算法,來動態計算出閾值。如果子任務很多,效率並不一定會高。
未完待續。。。
參考資料
http://gee.cs.oswego.edu/dl/papers/fj.pdf
https://docs.oracle.com/javase/tutorial/essential/concurrency/forkjoin.html
https://www.ibm.com/developerworks/cn/java/j-lo-forkjoin/
http://www.ibm.com/developerworks/cn/java/j-jtp11137.html
本文來自:高爽|Coder,原文地址:http://blog.csdn.net/ghsau/article/details/46287769,轉載請註明。
相關文章
- java多執行緒8:阻塞佇列與Fork/Join框架Java執行緒佇列框架
- java8平行計算Java
- Java併發基礎-Fork、Join方式的平行計算研究分析Java
- 面試官:說說你對Fork/Join的平行計算框架的瞭解?面試框架
- Java7提供的並行執行任務框架:Fork、Join框架Java並行框架
- Java 多執行緒基礎(十一)執行緒優先順序和守護執行緒Java執行緒
- 深入淺出Java多執行緒(十一):AQSJava執行緒AQS
- java多執行緒系列:Executors框架Java執行緒框架
- Java多執行緒學習(八)執行緒池與Executor 框架Java執行緒框架
- [930]python平行計算框架pathos模組Python框架
- Fork Join 併發任務執行框架框架
- Java Fork/Join 框架Java框架
- OpenCV使用ParallelLoopBody進行平行計算OpenCVParallelOOP
- Android程式框架:執行緒與執行緒池Android框架執行緒
- Java多執行緒-執行緒中止Java執行緒
- Java多執行緒之Executor框架和手寫簡易的執行緒池Java執行緒框架
- 平行計算π值
- 多執行緒高併發程式設計(8) -- Fork/Join原始碼分析執行緒程式設計原始碼
- Java多執行緒之執行緒中止Java執行緒
- Java多執行緒-執行緒狀態Java執行緒
- Java多執行緒-執行緒通訊Java執行緒
- java 多執行緒守護執行緒Java執行緒
- Java多執行緒(2)執行緒鎖Java執行緒
- java多執行緒9:執行緒池Java執行緒
- 【java多執行緒】(二)執行緒停止Java執行緒
- java執行緒執行緒休眠,sleep方法Java執行緒
- Java併發程式設計:Java執行緒Java程式設計執行緒
- Java併發程式設計之執行緒安全、執行緒通訊Java程式設計執行緒
- Java併發 -- Fork/Join框架Java框架
- Java執行緒篇——執行緒的開啟Java執行緒
- 【Java多執行緒】執行緒安全的集合Java執行緒
- 【Java】【多執行緒】執行緒池簡述Java執行緒
- Java執行緒池一:執行緒基礎Java執行緒
- Java多執行緒-執行緒池的使用Java執行緒
- Java執行緒池二:執行緒池原理Java執行緒
- springboot~CompletableFuture平行計算Spring Boot
- 【Java多執行緒】輕鬆搞定Java多執行緒(二)Java執行緒
- java執行緒之守護執行緒和使用者執行緒Java執行緒
- 關於linux多執行緒fork的理解和學習Linux執行緒