最佳化 Java Spark 服務忙了整整一週

0611163發表於2024-11-22

原文網址 : https://www.cnblogs.com/s0611163/p/18554707

JavaSpark

最佳化 Java Spark 服務忙了整整一週，嘗試了各種辦法和各種引數組合。

為什麼要最佳化

現網有個spark服務，白天資料量大，積壓資料，夜間資料量小，再把積壓的資料處理完，雖然達到了平衡，保證了每天的資料能處理完，但白天的資料處理延遲比較大。

資料積壓的原因

接手這個服務以來，我一直以為是因為下載圖片耗時長導致的資料處理速度慢。這周測試發現，儲存圖片的時候，判斷圖片是否存在，不存在則儲存圖片到本機資料夾，這兩個步驟有時耗時幾十毫秒，有時甚至耗時十幾分鍾！

難點

資料處理並行度小了不行，會導致資料處理速度慢；並行度大了也不行，會導致上述兩個步驟有機率出現特別慢的情況，從而有機率嚴重拖慢spark任務；透過測試發現，並行度無論怎麼設定，都會有機率出現特別慢的情況。

解決辦法

透過spark.streaming.kafka.maxRatePerPartition引數和JavaStreamingContext建構函式的batchDuration引數，控制資料流量
開啟spark推測執行，並設定合適的引數
透過redis分散式鎖控制並行度

關鍵程式碼如下：
spark.streaming.kafka.maxRatePerPartition引數設定：

 sparkConf.set("spark.streaming.kafka.maxRatePerPartition", "1");

推測執行引數設定：

sparkConf.set("spark.speculation", "true");
sparkConf.set("spark.speculation.interval", "5s");
sparkConf.set("spark.speculation.quantile", "0.1");
sparkConf.set("spark.speculation.multiplier", "6");

batchDuration引數設定：

JavaStreamingContext jssc = new JavaStreamingContext(jsc, Durations.milliseconds(10000));

Redis分散式鎖tryLock定義：

public static boolean tryLock(String key) {
    String r = RedisClusterUtil.getJedis().set(redisKeyPre + key, "value", "NX", "PX", 10);
    if ("OK".equals(r)) {
        return true;
    } else {
        return false;
    }
}

Redis分散式鎖tryLock使用

try {
    String key = String.valueOf(partitionId % 8);
    while (!RedisLock.tryLock(key)) {
        Thread.sleep(5);
    }
} catch (InterruptedException e) {
    log.error("獲取Redis鎖異常！！！");
}

說明：鎖超時釋放，沒有使用unlock手動釋放

最佳化效果

透過以上方法，降低了判斷圖片檔案是否存在和儲存圖片這兩個步驟出現長耗時的機率和出現長耗時時的耗時時長。
但是依然有機率會出現特別慢的情況。如下圖所示：

Spark截圖1

Spark截圖2

第五週週一（安卓端連線服務端）
2024-03-25
安卓服務端
一週雲事｜雲服務高速增長
2022-04-29
服務案例|故障頻發的一週，居然睡得更香！
2023-11-22
Facebook全球服務中斷，一週當機兩次
2021-10-09
HardwareUnboxed：AMD/NVIDIA顯示卡釋出一年反而貴了整整一倍
2021-11-22
jwt 如何實現一個服務認證了另一個服務也可以認證
2023-03-10
JWT
服務容器淺解,歡迎幫忙解答 call_user_func_array
2020-03-26
java第一週
2019-03-08
Java
Spark記錄（二）：Spark程式的生命週期
2021-11-07
Spark
redis自學（47）服務端最佳化
2024-06-21
Redis服務端
【死磕JVM】五年整整五年了該知道JVM載入機制了!
2021-02-28
JVM
我們又重寫了一個關鍵服務
2022-11-30
死磕一週演算法，我讓服務效能提高50%
2018-08-27
演算法
一週雲事|雲廠商“春耕忙”：劈柴、餵馬，搶灘市場
2022-04-02
每週一書《Spark與Hadoop大資料分析》分享！
2019-03-15
SparkHadoop大資料
Netty服務端開發及效能最佳化
2023-05-05
Netty服務端
Java Spring Cloud 與響應式微服務（一）服務註冊中心
2020-03-09
JavaSpringCloud微服務
Java與WCF互動（一)：Java客戶端呼叫WCF服務（轉）
2020-04-05
Java客戶端
螞蟻金服開源服務註冊中心 SOFARegistry | SOFA 開源一週年獻禮
2019-03-28
asp.net core服務的生命週期
2018-07-27
ASP.NET
短鏈服務介面慢最佳化 redis應用
2024-05-22
Redis
java WebSocket 服務端程式碼
2022-02-16
JavaWeb服務端
用Java寫一個分散式快取——RESP服務端
2023-02-08
Java分散式快取服務端
因為我最近忙、所以我寫了它
2020-06-16
『學了就忘』Linux服務管理 — 75、Linux系統中的服務
2021-12-13
Linux
一對一影片聊天app開發藉助了哪些CDN的服務功能？
2019-02-20
APP
Android四大元件之服務————服務的生命週期和啟動方式
2020-08-04
Android元件
spark記憶體管理這一篇就夠了
2020-11-13
Spark記憶體
Spark架構與原理這一篇就夠了
2020-11-11
Spark架構
第一次嘗試使用java寫spark
2019-05-29
JavaSpark
eclipse Java Spark local模式
2019-03-06
EclipseJavaSpark模式
『學了就忘』Linux服務管理 — 76、RPM包安裝的服務管理
2021-12-13
Linux
JAVA EE 第一週作業
2020-04-06
Java
Spark記錄（一）：Spark全景概述
2021-11-06
Spark
Java微服務：用Spark替代SpringBoot才是正確的方式 - Christian Lusardi
2019-02-21
Java微服務SparkSpring Boot
豐網快遞不斷最佳化服務，進一步提升快遞質量
2023-05-09
『學了就忘』Linux服務管理 — 79、原始碼包安裝的服務管理
2021-12-14
Linux原始碼
編寫Spark程式的幾個最佳化點
2021-09-09
Spark