.NET8極致效能最佳化CHRL

江湖評談發表於2023-11-30

前言

.NET8在.NET7的基礎上進行了進一步的最佳化,比如CHRL(全稱:CORINFO_HELP_RNGCHKFAIL)最佳化技術,CORINFO_HELP_RNGCHKFAIL是邊界檢查,在.NET7裡面它已經進行了部分最佳化,但是.NET8裡面它繼續最佳化,類似人工智慧,.NET8能意識到某些效能問題,從而進行最佳化。本篇來看下。原文:.NET8極致效能最佳化CHRL

概述

JIT會對陣列,字串的範圍邊界進行檢查。比如陣列的索引是否在陣列長度範圍內,不能超過。所以JIT就會產生邊界檢查的步驟。

public class Tests
{
    private byte[] _array = new byte[8];
    private int _index = 4;

    public void Get() => Get(_array, _index);

    [MethodImpl(MethodImplOptions.NoInlining)]
    private static byte Get(byte[] array, int index) => array[index];
}

Get函式.NET7的ASM如下:

; Tests.Get(Byte[], Int32)
       sub       rsp,28
       cmp       edx,[rcx+8]
       jae       short M01_L00
       mov       eax,edx
       movzx     eax,byte ptr [rcx+rax+10]
       add       rsp,28
       ret
M01_L00:
       call      CORINFO_HELP_RNGCHKFAIL
       int       3

cmp指令把陣列的MT(方法表)偏移8位置的陣列長度與當前的陣列索引對比,兩者如果索引大於(後者)或等於(jae)陣列長度(前者)的時候。就會跳轉到CORINFO_HELP_RNGCHKFAIL進行邊界檢查,可能會引發超出引範圍的異常IndexOutOfRangeException。但是實際上這段這段程式碼的訪問只需要兩個mov,一個是陣列的索引,一個是(MT(方法表)+0x10+索引)取其值返回即可。所以這個地方有清晰可見的最佳化的地方。
.NET8學習了一些範圍邊界的智慧化最佳化,也就說,有的地方不需要邊界檢查,從而把邊界檢查最佳化掉,用以提高程式碼的效能。下面例子:

 private readonly int[] _array = new int[7];
   public int GetBucket() => GetBucket(_array, 42);
   private static int GetBucket(int[] buckets, int hashcode) =>
   buckets[(uint)hashcode % buckets.Length];

.NET7它的ASM如下:

; Tests.GetBucket()
       sub       rsp,28
       mov       rcx,[rcx+8]
       mov       eax,2A
       mov       edx,[rcx+8]
       mov       r8d,edx
       xor       edx,edx
       idiv      r8
       cmp       rdx,r8
       jae       short M00_L00
       mov       eax,[rcx+rdx*4+10]
       add       rsp,28
       ret
M00_L00:
       call      CORINFO_HELP_RNGCHKFAIL
       int       3

它依然進行了邊界檢查,然.NET8的JIT能自動識別到(uint)hashcode%buckets.Length這個索引不可能超過陣列的長度也就是buckets.Length。所以.NET8可以省略掉邊界檢查,如下.NET8 ASM

; Tests.GetBucket()
       mov       rcx,[rcx+8]
       mov       eax,2A
       mov       r8d,[rcx+8]
       xor       edx,edx
       div       r8
       mov       eax,[rcx+rdx*4+10]
       ret

再看下另外一個例子:

public class Tests
{
    private readonly string _s = "\"Hello, World!\"";

    public bool IsQuoted() => IsQuoted(_s);

    private static bool IsQuoted(string s) =>
    s.Length >= 2 && s[0] == '"' && s[^1] == '"';
}

IsQuoted檢查字串是否至少有兩個字元,並且字串開頭和結尾均以引號結束,s[^1]表示s[s.Length - 1]也就是字串的長度。.NET7 ASM如下:

; Tests.IsQuoted(System.String)
       sub       rsp,28
       mov       eax,[rcx+8]
       cmp       eax,2
       jl        short M01_L00
       cmp       word ptr [rcx+0C],22
       jne       short M01_L00
       lea       edx,[rax-1]
       cmp       edx,eax
       jae       short M01_L01
       mov       eax,edx
       cmp       word ptr [rcx+rax*2+0C],22
       sete      al
       movzx     eax,al
       add       rsp,28
       ret
M01_L00:
       xor       eax,eax
       add       rsp,28
       ret
M01_L01:
       call      CORINFO_HELP_RNGCHKFAIL
       int       3

注意看.NET7的騷操,它實際上進行了邊界檢查,但是隻檢查了一個,因為它只有一個jae指令跳轉。這是為什麼呢?JIT已經知道不需要對s[0]進行邊界檢查,因為s.Length >= 2已經檢查過了,只要是小於2的索引(因為索引是無符號,沒有負數)都不需要檢查。但是依然對s[s.Length - 1]進行了邊界檢查,所以.NET7雖然也是騷操,但是它這個騷操不夠徹底。
我們來看下徹底騷操的.NET8

; Tests.IsQuoted(System.String)
       mov       eax,[rcx+8]
       cmp       eax,2
       jl        short M01_L00
       cmp       word ptr [rcx+0C],22
       jne       short M01_L00
       dec       eax
       cmp       word ptr [rcx+rax*2+0C],22
       sete      al
       movzx     eax,al
       ret
M01_L00:
       xor       eax,eax
       ret

完全沒有了邊界檢查,JIT不僅意識到s[0]是安全的,因為檢查過了s.Length >= 2。因為檢查過了s.Length >= 2,還意識到s.length> s.Length-1 >=1。所以不需要邊界檢查,全給它最佳化掉了。

可以看到.NET8的效能最佳化的極致有多厲害,它基本上榨乾了JIT的引擎,讓其進行最大智慧化程度的最佳化。


點選下加入技術討論群:

歡迎加入.NET技術交流群

結尾

作者:江湖評談
歡迎關注公眾號:jianghupt,文章首發,以及更多高階內容分享。
image

相關文章