Dart編譯技術在服務端的探索和應用

闲鱼技术發表於2019-04-14

原文網址 : https://www.jiqizhixin.com/articles/2019-04-15-4

前言

最近閒魚技術團隊在Flutter+Dart的多端一體化的基礎上，實現了基於FaaS研發模式，Dart為FaaS的語言容器。Dart吸取了其它高階語言設計的精華，例如Smalltalk的Image技術,此外JVM的HotSpot和Dart編譯技術又師出同門。由Dart實現的語言容器，我們相信它在啟動速度、執行效能會有不錯的表現。同時Dart提供了AoT、JIT的編譯方式，JIT又有Kernel和AppJIT的執行模式，為了提升應用效能如何選擇合理的編譯方式？

另外，服務端應用一般有各自的特點，若按生命週期長短來分有短週期應用和長週期應用，編譯工作在不同應用的效能影響也有不同。接下來我們用一些有典型特點的案例來引入我們在Dart編譯方案的實踐和思考。

短週期應用

01 EmptyMain

例子是一個空函式實現，以此來評估語言平臺本身的啟動效能，我們使用預設引數編譯一個snapshot。

#1.預設條件下的app-jit snapshot生成
dart snapshot-kind=app-jit snapshot=empty_main.snapshot empty_main.dart

測試結果

Dart編譯技術在服務端的探索和應用

作為現代高階語言Dart和Java在啟動速度上在同一水平線；
C語言的啟動速度是其它語言的20x，基本原因是C沒有Java、Dart語言平臺的Runtime；
Kernel和AppJIT方式執行有穩定的微小差異，總體AppJIT優於Kernel。

02 Fibonacci數列

我們分別用C、Java、Dart用遞迴實現Fibonacci(50)數列，來考察編譯工作對效能的影響。

long fibo(long n){
  if(n < 2){
    return n;
  }
  return fibo(n - 1) + fibo(n - 2);
}

AppJIT使用優化閾值實現激進優化,這樣編譯器在Training Run中立即獲得生成Optimized程式碼

#2.執行激進優化          
dart --no-background-compilation \
     --optimization-counter-threshold=1 \ 
     --snapshot-kind=app-jit \
     --snapshot=fibonacci.snapshot
     fibonacci.dart

將Fibonacci編譯成Kernel

#3.生成Kernel snapshot
dart --snapshot=fibonacci.snapshot fibonacci.dart

AoT的Runtime不在Dart SDK裡，需要自行編譯AoT Runtime

#4.AoT編譯
pkg/vm/tools/precompiler2 fibonacci.dart fibonacci.aot

#5.AoT的方式執行
out/ReleaseX64/dart_precompiled_runtime fibonacci.aot

測試結果

Dart編譯技術在服務端的探索和應用

Dart JIT對比下,AppJIT在激進優化後效能稍好於Kernel，差距微小，編譯的成本佔比可以忽略不計；
Dart AoT模式下的效能約為JIT的1/6不到；
JIT執行模式下，HotSpot的執行效能最優，優於Dart AppJIT 25%以上；
包括C語言在內的AoT執行模式效能均低於JIT,Dart AppJIT效能優於25%。

問題

AoT由於自身的特性(和語言無關)，無法在執行時基於Profile實現程式碼優化，峰值效能在此場景下要差很多，但是為何Dart VM比HotSpot有25%的差距？接下來我們針對Fibonacci做進一步優化。

#6.編譯器調優，調整遞迴內聯深度
dart --inlining_recursion_depth_threshold=5 fibonacci.snapshot 50

#7.編譯器調優，HotSpot調整遞迴內聯深度
java -XX:MaxRecursiveInlineLevel=5 Fabbonacci 50

測試結果

Dart編譯技術在服務端的探索和應用

HotSpot VM效能全面領先於Dart VM;兩者在最優情況下HotSpot VM的效能優於Dart 9%左右；
Dart VM 藉助JIT調優，效能有大幅提升，相比預設情況有40%左右的提升；
Dart AppJIT 效能微弱領先Kernel。

也許也不難想象JVM HotSpot目前在伺服器開發領域上的相對Dart成熟，相比HotSpot，DartVM的“出廠設定”比較保守，當然我們也可以大膽猜測，在服務端應用下應該還有除JIT的其它優化空間；
和Case1相同，Kernel模式的效能依然低於AppJIT,主要原因是Kernel在執行前期需要把AST轉換為堆資料結構、經歷Compile、Compile Optimize等過程，而在適當Training run後的AppJIT snapshot在VM啟動時以優化後的IL(中間程式碼)執行，但很快Kernel會追上App-jit，最後效能保持持平。有興趣的讀者可以參閱Vyacheslav Egorov Dart VM的文章。

03 Faas容器編譯工具

在前面我們提到過Dart版本的FaaS語言容器，為追求極致的研發體驗，我們需要縮短使用者Function打包到部署執行的時間。就語言容器層面而言，Dart提供的Snapshot技術可以大大提升啟動速度，但是從使用者Function到Snapshot（如下圖）生成所產生的編譯時間在不做優化的情況下超過10秒,還遠遠達不到極致體驗的要求。我們這裡通過一些測試，來尋找提升效能的途徑。

Dart編譯技術在服務端的探索和應用

faastool是一個完全用Dart編寫的程式碼編譯、生成工具。依託於faastool, Function的編寫者不用關心如何打包、接入中介軟體，faastool提供一系列的模版及程式碼生成工具可以將使用者的使用成本降低，此外faastool還提供了HotReload機制可以快速響應變更。

這次我們提供了基於AoT、Kernel、AppJIT的用例來執行Function構建流程，分別記錄時間消耗、中間產物大小、產物生成時間。為了驗證在JIT場景下DartVM是否可通過調整Complier的行為帶來效能提升，我們增加了JIT的測試分組。

測試結果

AoT>AppJIT>kernel，其中AoT比優化後的AppJIT有3倍左右效能提升，效能是Source的1000倍。
JIT(Kernel, AppJIT)分組下，通過在執行時減少CompilerOptimize或暫停PGO可以提升效能。

很顯然faas_tool最終選擇了AoT編譯，但是效能結果和Case2大相徑庭，為了搞清楚原因我們進一步做一下CPU Profile。

04 CPU profile

AppJIT

Dart編譯技術在服務端的探索和應用

Dart App-jit模式 43%以上的時間參與編譯,當然取消程式碼優化,可以讓編譯時間大幅下降，在優化情況下可以將這個比率下降到13%。

Kernel

Dart編譯技術在服務端的探索和應用

Kernel模式有61%以上的CPU時間參與編譯工作, 如果關閉JIT優化程式碼生成,效能有15%左右提升,反之進行激進優化將有1倍左右的效能損耗。

AoT下的編譯成本
Dart編譯技術在服務端的探索和應用 AoT模式下在執行時幾乎編譯和優化成本(CompileOptimized、CompileUnoptimized、CompileUnoptimized 佔比為0)，直接以目標平臺的程式碼執行，因此效能要好很多。

P.S. DartVM 的Profile模組在後期的版本升級更改了Tag命名, 有需要進一步瞭解的讀者參考VM Tags

附：DartVM調優和命令程式碼

#8.模擬單核並執行激進優化           
dart --no-background-compilation \
     --optimization-counter-threshold=1 \ 
      tmp/faas_tool.snapshot.kernel 

#9.JIT下關閉優化程式碼生成
dart --optimization-counter-threshold=-1 \ 
      tmp/faas_tool.snapshot.kernel 

#10. Appjit verbose snapshot
dart --print_snapshot_sizes \
     --print_snapshot_sizes_verbose \
     --deterministic  \
     --snapshot-kind=app-jit \
     --snapshot=/tmp/faas_tool.snapshot faas_tool.dart \

#11.Profile CPU 和 timeline 
dart --profiler=true \
     --startup_timeline=true \
     --timeline_dir=/tmp \
     --enable-vm-service \
     --pause-isolates-on-exit faas_tool.snapshot

長週期應用

01 HttpServer

我們用一個簡單的Dart版的HttpServer作為典型長週期應用的測試用例，該用例中有JsonToObject、ObjectToJson的轉換，然後response輸出。我們分別用Source、Kernel以及AppJIT的方式在一定的併發量下執行一段時間。

void processReq(HttpRequest request){
  try{
    final List<Map<String,dynamic>> buf = <Map<String,dynamic>>[];
    final Boss boss = new Boss(numOfEmployee: 10);
    //Json反序列化物件
    getHeadCount(max: 20).forEach((hc){
      boss.hire(hc.idType, hc.docId);
      buf.add(hc.toJson());
    });
    request.response.headers.add('cal','${boss.calc()}');
    //Json物件轉JsonString
    request.response.write(jsonEncode(buf));
    request.response.close()
      .then((v) => counter_success ++)
      .timeout(new Duration(seconds:3))
      .catchError((e) => counter_fail ++));
  }  
  catch(e){
    request.response.statusCode = 500;
    counter_fail ++;
    request.response.close();
  }
}

測試結果

Dart編譯技術在服務端的探索和應用

上面三種無論是何種方式啟動，最終的執行時效能趨向一致，編譯成本在後期可以忽略不計，這也是JIT的執行特點。
在AppJIT模式下在應用啟動起初就有接近峰值的效能，即使在Kernel模式下也需要時間預熱達到峰值效能，Source模式下VM啟動需要2秒以上，因此需要相對更長時間達到峰值效能。從另一方面看應用很快完成了預熱，不久達到了峰值效能。

P.S. 長週期的應用Optimize Compiler會經過Optimize->Deoptimize->Reoptimize的過程, 由於此案例比較簡單，沒體現Deoptimize到Reoptimize的表現

VM調優指令碼

#12.調整當前isolate的新生代大小，預設2M最大32M的新生代大小造成頻繁的YGC
dart --new_gen_semi_max_size=512  \
     --new_gen_semi_initial_size=512  \ 
     http_server.dart \
     --interval=2

總結和展望

我們通過對在服務端開發中幾種常見特徵應用的測試，我們瞭解到，

Dart編譯方式的選擇

編譯成本為主導的應用，優先考慮AoT來提高應用效能；
大多數長週期的應用在啟動後期編譯成本可忽略，應該選擇JIT方式並開啟Optimize Compiler執行；
大多數長週期的應用可以選擇Kernel的方式來提升啟動速度，通過AppJIT的方式進一步縮短warmup時間。

AppJIT減少了編譯預熱的成本，這個特性非常適合對一些高併發應用線上擴容。Kernel作為Dart編譯技術的前端，其平臺無關性將繼續作為整個Dart編譯工具鏈的基礎。

在FaaS構建方案的選擇

通過CPU Profile得出faas_tool是一個編譯成本主導的應用，最終選擇了AoT編譯方案，結果大大提升了語言容器的構建的構建速度，很好滿足了faas對開發效率的訴求。

仍需改進的地方

從JIT效能表現來看，DartVM JIT的執行時性和HotSpot相比有提升餘地，由於Dart語言作為服務端開發的歷史不長，也許隨著Dart在服務端的技術應用全面推廣，相信DarVM在編譯器後端技術上對伺服器級的處理器架構做更多優化。

附：案例環境

#實驗機1
Mac OS X 10.14.3 
Intel(R) Core(TM) i7-4770HQ CPU @ 2.20GHz * 4 / 16GB RAM

#實驗機2
Linux x86_64
Intel(R) Xeon(R) CPU E5-2650 v2 @ 2.60GHz * 4 / 8GB RAM

#Dart版本
Dart Ver. 2.2.1-edge.eeb8fc8ccdcef46e835993a22b3b48c0a2ccc6f1 

#Java HotSpot版本
Java build 1.8.0_121-b13 
Java HotSpot(TM) 64-Bit Server VM (build 25.121-b13, mixed mode)

#GCC版本
Apple LLVM version 10.0.1 (clang-1001.0.46.3)
Target: x86_64-apple-darwin18.2.0
Thread model: posix

情感分析技術在美團的探索與應用
2021-10-26
深入探索編譯插樁技術（二、AspectJ）
2020-04-02
編譯
vue：服務端渲染技術
2018-03-02
Vue服務端
Vue 服務端渲染技術
2018-04-24
Vue服務端
GPU在AI業務中的核心技術與應用
2022-01-11
GPUAI
區塊鏈技術應用場景開發方案,智慧合約編寫服務
2019-11-29
區塊鏈
服務端主動推送技術☞WebSocket
2019-05-25
服務端Web
服務端技術方案模板參考
2023-02-16
服務端
圖技術在美團外賣下的場景化應用及探索
2022-11-24
vivo直播應用技術實踐與探索
2022-02-09
Web前端AR技術探索-導航中的應用
2018-12-28
Web前端
分析技術在PMP中的應用
2018-09-26
凹凸技術揭祕 · 基礎服務體系 · 構築服務端技術中樞
2021-01-15
服務端
MySQL Binlog 技術原理和業務應用案例分析
2020-07-15
MySql
客戶端跳轉技術，服務端跳轉技術，兩種跳轉的各自使用場合和特點
2024-05-03
客戶端服務端
騰訊安全和安徽徵信達成戰略合作，共同探索資料技術在智慧金融、智慧政務等領域的應用
2020-07-14
在快應用中整合華為AGC雲端儲存服務
2021-08-13
GC
2018服務端架構師技術圖譜
2018-07-03
服務端架構
RFID技術在服裝生產資訊化管理中的應用分析
2021-11-11
【go】【應用編譯】
2024-05-31
Go編譯
從零建立一個 Dart 服務端專案
2019-05-16
Dart服務端
區塊鏈技術應用開發,公鏈搭建服務商
2019-12-06
區塊鏈
[Flutter翻譯]探索Dart的新構建系統
2020-07-22
FlutterDart
騰訊遊戲探索“觸覺反饋”技術在無障礙領域的應用
2021-12-03
遊戲
編譯和分發 Chez Scheme 應用程式
2024-09-08
編譯Scheme
如何編譯C#版本的Protocol Buffers與gRPC服務端，客戶端程式碼
2019-05-24
編譯C#ProtocolRPC服務端客戶端
Java服務端容器化：Docker與Kubernetes的應用
2024-09-01
Java服務端Docker
Mock技術在測試領域的應用
2020-04-06
Mock
大資料技術在電商的應用
2019-04-22
大資料
服務端推送技術 Server-sent Events 快速上手
2019-08-22
服務端Server
阿里雲ECS伺服器部署Dart服務端程式
2018-11-29
阿里伺服器Dart服務端
grpc套路服務端編寫
2020-08-18
RPC服務端
XML Web 服務技術解析：WSDL 與 SOAP 原理、應用案例一覽
2024-05-31
XMLWeb
洞見RSAC | 生物行為識別技術在社工詐騙中的應用分析與探索
2021-06-09
gitblit服務端在windows的搭建
2018-04-07
Git服務端Windows
資訊公交服務在滴滴的應用實踐
2020-09-29
Disruptor在雲音樂特徵服務中的應用
2022-05-12
特徵
釘釘協同引擎與應用場景技術探索
2022-03-30

Dart編譯技術在服務端的探索和應用

前言

短週期應用

長週期應用

總結和展望

相關文章