JIT編譯器推導求餘%上下界引發的一連串故事

kelthuzadx發表於2021-05-28

原文網址 : https://www.cnblogs.com/kelthuzadx/p/14821304.html

C1 RCE對%的處理

HotSpot VM的C1有個RCE（Range Check Elimination，範圍檢查消除）優化，所謂範圍檢查消除，就是為了正確的丟擲陣列越界異常，虛擬機器需要在陣列訪問的一些地方插入隱式的檢查，但是這些檢查會降低效能，比如在迴圈中每次迴圈都得檢查一次，所以HotSpot VM會想辦法在可能的地方消除這些檢查。我在看C1 RCE的時候發現目前它對求餘符號的支援較為薄弱，它只能處理形如下面的程式碼：

arr[x%arr.length] // 只有除數是x.length的時候，才能應用RCE優化

如果餘數是整數常量，它就不能工作了：

arr[x%3]
for(int i=0;i<10;i++){
  arr[x%10]
}

實際上，根據JLS的定義，我們知道如果除數為整數常量（且等於零，因為0作為除數會丟擲執行時異常），是可以推匯出結果的上下界的（也取決於被除數的正負），規則如下：

x % -y ==> [0, y - 1]
x % y ==> [0, y - 1]
-x % y ==> [-y + 1, 0]
-x % -y ==> [-y + 1, 0]

於是，我給JDK發了個patch，這個問題算是解決了。但是Nils提到，C2是否有相同的優化呢？後面Tobias幫忙確認了一下C2沒有，我再後來也進一步確認了，所以下一步是調研C2是否能應用同樣的優化。

調研為C2應用同樣的優化

本來以為是比較trivial的事情，為求餘節點的型別系統加點程式碼，推導一下上下界即可，實際上我也這麼做的，但是最後發現這樣沒有消除上下界。預設開啟-XX:+GenerateRangeChecks後，在陣列訪問過程中（Parse::array_addressing），C2仍然生成了範圍檢查。

除錯後發現推導上下界根本沒有執行，因為C2建立完求餘節點後，會執行一個IGVN的過程，即迭代的應用多種優化，其中就包括理想化，C2理想化是指應用很多區域性小優化的過程，在這個例子中就是特殊處理形如x%2^n,x%2^n-1和x%1的情況，如果除數是整數常量，它還會使用一個來自https://book.douban.com/subject/1784887/書裡面的演算法，即Division by Invariant Integers using Multiplication(by Granlund and Montgomery)，搜了一下知乎有類似的文章，想要了解細節可以讀讀https://zhuanlan.zhihu.com/p/151038723。知道了原因，於是我改了下程式碼，禁止了求餘節點的理想化，心想這總可以了吧。

還是不行

是的，還是不行。儘管我已經禁止了對求餘符號的理想化優化，但是範圍檢查還是生成了。。。我又繼續看程式碼，發現除了理想化的這個優化之外，C2在IR（中間表示）構造的過程中又又又又又對求餘運算做了個優化！如果除數是正整數常量，且是2^n，那麼C2會對它進行變形，IR如圖所示：

左邊的IR是 IR構造的時候C2做的優化後的效果，右邊是理想化優化後的效果。實際上它們做的事情本身是比較重複的，而且經過測試發現，理想化優化的演算法要好於IR構造過程中的優化：

一個簡單的micro benchmark：

public class ModPowerOf2 {
    @Benchmark
    public int testPositivePowerOf2() {
        int sum = 0;
        for (int i = 0; i < 1000; i++) {
            sum += i % 1;
            sum += i % 2;
            sum += i % 4;
            sum += i % 8;
            sum += i % 16;
            sum += i % 32;
            sum += i % 64;
            sum += i % 128;
            sum += i % 256;
            sum += i % 512;
            sum += i % 1024;
            sum += i % 2048;
            sum += i % 4096;
            sum += i % 8192;
            sum += i % 16384;
            sum += i % 32768;
            sum += i % 65536;
        }
        return sum;
    }

    @Benchmark
    public int testNegativePowerOf2() {
        int sum = 0;
        for (int i = 0; i < 1000; i++) {
            sum += i % -1;
            sum += i % -2;
            sum += i % -4;
            sum += i % -8;
            sum += i % -16;
            sum += i % -32;
            sum += i % -64;
            sum += i % -128;
            sum += i % -256;
            sum += i % -512;
            sum += i % -1024;
            sum += i % -2048;
            sum += i % -4096;
            sum += i % -8192;
            sum += i % -16384;
            sum += i % -32768;
            sum += i % -65536;
        }
        return sum;
    }
}

理想化：

Benchmark Mode Cnt Score Error Units
ModPowerOf2.testNegativePowerOf2 avgt 25 8746.608 ± 139.777 ns/op
ModPowerOf2.testPositivePowerOf2 avgt 25 8735.545 ± 86.145 ns/op

IR構造優化：

Benchmark Mode Cnt Score Error Units
ModPowerOf2.testNegativePowerOf2 avgt 25 8693.797 ± 7.844 ns/op
ModPowerOf2.testPositivePowerOf2 avgt 25 6618.652 ± 1.739 ns/op

所以我提了個patch，準備移除IR構造做的優化來解決這個問題。

結語

我認為為求餘節點推導上下界也是有意義的，如果以後有其他優化會變形為求餘運算，那麼它們可以應用這個推導，同時，為求餘做統一完善的型別推導這件事本身也是正確的，所以我又提了個patch。可以看到，最終我只消除了C1 arr[x%4]的範圍檢查，還是沒能消除C2 arr[x%4]的範圍檢查，是不是以後可以說C1有的地方做的比C2好了（狗頭hh。

JIT 編譯器快速入門
2019-02-21
編譯
線性同餘-常見語言編譯器引數
2024-05-10
編譯
GCC編譯器背後的故事
2020-10-17
GC編譯
Angular–AOT和JIT編譯
2019-03-01
Angular編譯
[譯][A crash course in WebAssembly] Just-in-time(JIT)編譯器速成課
2019-02-27
Web編譯
一次依賴注入不慎引發的一連串事故
2020-06-07
依賴注入
嵌入式—編譯器背後的故事
2020-10-15
編譯
JIT 編譯後的程式碼儲存位置
2024-12-10
編譯
編譯器背後的故事（入門練習）
2020-10-16
編譯
程式碼線上編譯器（上）- 編輯及編譯
2018-10-30
編譯
提前編譯：AOT-Native Image 和執行時編譯 JIT
2024-07-21
編譯
Ruby 將引入新 JIT 編譯器：YJIT，平均速度提升 23%
2021-11-02
編譯
深入瞭解Java JIT編譯器：原理與效能最佳化
2023-03-16
Java編譯
動手試試ClassLoader，直譯器，JIT
2020-11-30
如何製作一款線上編譯器
2019-07-22
編譯
Mybatis PageHelper編譯SQL引發的一次效能問題.18286262
2024-07-05
MyBatis編譯SQL
JVM實用引數（一）JVM型別以及編譯器模式
2021-11-28
JVM型別編譯模式
JIT-動態編譯與AOT-靜態編譯：java/ java/ JavaScript/Dart亂談
2021-08-24
編譯JavaScriptDart
【譯】Ruby2.6的JIT功能，編譯和解釋型語言的相關說明
2019-02-03
編譯
聊聊最近求職發生的故事
2018-04-07
求職
php編譯引數
2021-09-09
PHP編譯
刪除win10多餘開機引導的方法_win10怎麼刪掉多餘的開機引導項
2020-05-13
Win10
一個老同學的故事引發的nodejs 爬蟲
2018-08-24
NodeJS爬蟲
[譯] Slidable：一個 Flutter 的故事
2019-03-01
Flutter
Ubuntu上的pycrypto給出了編譯器錯誤
2019-02-15
Ubuntu編譯
推薦Linux系統中4款好用的編譯器！
2023-12-12
Linux編譯
Python語言常用的編譯器有哪些？工具推薦！
2021-04-14
Python編譯
NDK clang編譯器的一個bug
2020-05-10
編譯
【底層】 C++和C#的編譯方式差異 / AOT和JIT
2024-08-18
C++C#編譯
.Net8的快速JIT，分層編譯，R2R的設定
2023-04-27
編譯
深入剖析Java即時編譯器（上）
2019-03-13
Java編譯
推薦幾款火爆的Python線上編輯器
2024-05-13
Python
你瞭解JVM中的 JIT 即時編譯及優化技術嗎？
2018-07-01
JVM編譯優化
編譯器的自展和自舉、交叉編譯
2020-12-24
編譯
淺談彙編器、編譯器和直譯器
2019-06-26
編譯
記一起由 Clang 編譯器優化觸發的 Crash
2020-12-11
編譯優化
iOS開發你不知道的事-編譯&連結
2019-05-10
iOS編譯
GCC編譯過程（預處理-＞編譯-＞彙編-＞連結）
2020-09-30
GC編譯

JIT編譯器推導求餘%上下界引發的一連串故事

C1 RCE對%的處理

調研為C2應用同樣的優化

還是不行

結語

相關文章