要怎樣才能夠完美的編寫高效能的RPC框架

爛豬皮發表於2018-04-20

原文網址 : https://juejin.im/post/5ad84ce46fb9a045fd336a84

RPC 的主要流程

客戶端獲取到 UserService 介面的 Refer: userServiceRefer
客戶端呼叫 userServiceRefer.verifyUser(email, pwd)
客戶端獲取到請求方法和請求資料
客戶端把請求方法和請求資料序列化為傳輸資料
進行網路傳輸
服務端獲取到傳輸資料
服務端反序列化獲取到請求方法和請求資料
服務端獲取到 UserService 的 Invoker: userServiceInvoker
服務端 userServiceInvoker 呼叫 userServiceImpl.verifyUser(email, pwd) 獲取到響應結果
服務端把響應結果序列化為傳輸資料
進行網路傳輸
客戶端接收到傳輸資料
客戶端反序列化獲取到響應結果
客戶端 userServiceRefer.verifyUser(email, pwd) 返回響應結果

整個流程中對效能影響比較大的環節有：序列化[4, 7, 10, 13]，方法呼叫[2, 3, 8, 9, 14]，網路傳輸[5, 6, 11, 12]。本文後續內容將著重介紹這3個部分。

序列化方案

Java 世界最常用的幾款高效能序列化方案有 Kryo Protostuff FST Jackson Fastjson。只需要進行一次 Benchmark，然後從這5種序列化方案中選出效能最高的那個就行了。DSL-JSON 使用起來過於繁瑣，不在考慮之列。Colfer Protocol Thrift 因為必須預先定義描述檔案，使用起來太麻煩，所以不在考慮之列。至於 Java 自帶的序列化方案，早就因為效能問題被大家所拋棄，所以也不考慮。下面的表格列出了在考慮之列的5種序列化方案的效能。

User 序列化+反序列化效能

framework thrpt (ops/ms) size

protostuff	1654	240
kryo	1288	296
fst	1101	263
jackson	959	385
fastjson	603	378

包含15個 User 的 Page 序列化+反序列化效能

framework thrpt (ops/ms) size

kryo	143	2080
fst	118	3495
protostuff	98	3920
jackson	71	5711
fastjson	40	5606

從這個 benchmark 中可以得出明確的結論：二進位制協議的 protostuff kryo fst 要比文字協議的 jackson fastjson 有明顯優勢；文字協議中，jackson(開啟了afterburner) 要比 fastjson 有明顯的優勢。

無法確定的是：3個二進位制協議到底哪個更好一些，畢竟速度和 size 對於 RPC 都很重要。直觀上 kryo 或許是最佳選擇，而且 kryo 也廣受各大型系統的青睞。不過最終還是決定把這3個類庫都留作備選，通過整合傳輸模組後的 Benchmark 來決定選用哪個。

framework existUser (ops/ms) createUser (ops/ms) getUser (ops/ms) listUser (ops/ms)

protostuff	103.92	89.50	83.33	21.17
kryo	99.23	76.71	73.89	25.68
fst	102.33	76.24	78.81	23.30

最終的結果也還是各有千秋難以抉擇，所以 Turbo 保留了 protostuff 和 kryo 的實現，並允許使用者自行替換為自己的實現。

方法呼叫

可用的動態方法呼叫方案有：Reflection ClassGeneration MethodHandle。Reflection 是最古老的技術，據說效能不佳。ClassGeneration 動態類生成，從原理上說應該是跟直接呼叫一樣的效能。MethodHandle 是從 Java 7 開始出現的技術，據說能達到跟直接呼叫一樣的效能。實際結果如下：

type thrpt (ops/us)

direct	1062
javassist	920
methodHandle	430
reflection	337

結論非常明顯：使用類生成技術的 javassist 跟直接呼叫幾乎一樣的效能，就用 javassist 了。

MethodHandle 表現並沒有宣傳的那麼好，怎麼回事？原來 MethodHandle 只有在明確知道呼叫引數數量引數型別的情況下才能呼叫高效能的 invokeExact(Object... args)，所以它並不適合作為動態呼叫的方案。

As is usual with virtual methods, source-level calls to invokeExact and invoke compile to an invokevirtual instruction. More unusually, the compiler must record the actual argument types, and may not perform method invocation conversions on the arguments. Instead, it must push them on the stack according to their own unconverted types. The method handle object itself is pushed on the stack before the arguments. The compiler then calls the method handle with a symbolic type descriptor which describes the argument and return types.
refer: docs.oracle.com/javase/7/do…

網路傳輸

Netty 已經成為事實上的標準，所有主流的專案現在使用的都是 Netty。Mina Grizzly 已經失去市場，所以也就不用考慮了。還好也不至於這麼無聊，Aeron 的閃亮登場讓 Netty 多了一個有力的競爭對手。

Aeron 是一個可靠高效的 UDP 單播 UDP 多播和 IPC 訊息傳遞工具。效能是訊息傳遞中的關鍵。Aeron 的設計旨在達到高吞吐量低開銷和低延遲

。實際效果到底如何呢？很遺憾，在 RPC Benchmark Round 1 中的表現一般。跟他們開發團隊溝通後，最終確認其無法對超過 64k 的訊息進行 zero-copy 處理，我覺得這可能是 Aeron 表現不佳的一個原因。Aeron 或許更適合微小訊息極端低延遲的場景，而不適用於更加通用的 RPC 場景。所以暫時還沒有出現能夠跟 Netty 一爭高下的通用網路傳輸框架，現階段 Netty 依然是 RPC 系統的最佳選擇。

existUser 判斷某個 email 是否存在

framework thrpt (ops/ms) avgt (ms) p90 (ms) p99 (ms) p999 (ms)

turbo-rpc	107.05	0.28	0.40	0.87	4.06
netty	99.81	0.32	0.40	0.52	1.16
jupiter	73.07	0.44	0.66	1.49	2.92
undertow	70.38	0.45	1.16	2.17	32.48
turbo-rest	68.49	0.44	1.17	2.15	25.66
undertow-async	62.65	0.49	1.14	2.41	24.84
dubbo-kryo	57.35	0.53	0.67	1.02	11.65
rapidoid	52.96	0.61	1.32	2.51	25.07
dubbo	52.12	0.54	0.67	0.92	3.93
motan	44.96	0.71	1.15	2.47	33.39
aeron	43.46	0.90	1.32	5.10	14.29
grpc	38.97	0.84	1.07	1.31	6.06
thrift	27.25	1.59	0.16	64.87	122.83
hprose	26.24	1.26	1.53	2.01	8.34
springwebflux	22.39	1.42	2.27	3.19	17.20
springboot	12.54	1.68	2.38	13.63	33.20

訊息格式

我們先來看一下 Dubbo 的訊息格式

public class RpcInvocation implements Invocation, Serializable {
    private String methodName;
    private Class<?>[] parameterTypes;
    private Object[] arguments;
    ...
}
複製程式碼

可以說是非常經典的設計，Client 必須告知 Server 要呼叫的方法名稱引數型別引數。Server 獲取到這3個引數後，通過

方法名稱 com.alibaba.service.auth.UserService.verifyUser

和

引數型別 (String, String)

獲取到 Invoker，然後通過 Invoker 實際呼叫 userServiceImpl 的 verifyUser(String, String) 方法。其他的眾多 RPC 框架也都採取了這一經典設計。

但是，這是正確的做法嗎？當然不是，這種做法非常浪費空間，每次請求訊息體的大概記憶體佈局應該是下面的樣子。 public boolean verifyUser(String email, String pwd) 大致的記憶體佈局：

|com.alibaba.service.auth.UserService.verifyUser|java.lang.String,java.lang.String|實際的引數|

囉裡囉嗦的，浪費了 80 byte 來定義方法和引數，並沒有比 http+json 的方式高效多少。實際的效能測試也證明了這一點，undertow+jackson 要比 dubbo motan 的成績都要好。

那什麼才是正確的做法？Turbo 在訊息格式上做出了非常大的改變。

public classRequestimplementsSerializable{
    private int requestId;
    private int serviceId;
    private MethodParam methodParam;
    ...
}
複製程式碼

public boolean verifyUser(String email, String pwd) 大致的記憶體佈局：

|int|int|實際的引數|

高效多了，只用了 4 byte 就做到了方法和引數的定義。大大減小了傳輸資料的 size，同時 int 型別的 serviceId 也降低了 Invoker 的查詢開銷。

看到這裡，有同學可能會問：那豈不是要為每個方法定義一個唯一 id ？答案是不需要的，Turbo 解決了這一問題，詳情參考 TurboConnectService 。

推薦一個交流學習群：575745314 裡面會分享一些資深架構師錄製的視訊錄影：有Spring，MyBatis，Netty原始碼分析，高併發、高效能、分散式、微服務架構的原理，JVM效能優化這些成為架構師必備的知識體系。還能領取免費的學習資源，目前受益良多：

MethodParam 簡介

MethodParam 才是 Turbo 效能炸裂的真正原因。其基本原理是利用 ClassGeneration 對每個 Method 都生成一個MethodParam 類，用於對方法引數的封裝。這樣做的好處有：

減少基本資料型別的裝箱拆箱開銷
序列化時可以省略掉很多型別描述，大大減小傳輸訊息的 size
使 Invoker 可以高效呼叫被代理類的方法
統一 RPC 和 REST 的資料模型，簡化序列化反序列化實現
大大加快 json 格式資料反序列化速度

//方法 test(long id, int value) 將會生成下面的 MethodParam 類:	 
public class TestService_test_2_MethodParam implements MethodParam {
    private long id;
    private int value;
	 
    public long $param0() { return this.id; }
    public int $param1() { return this.value; }

    //... getters and setters
	 
    publicTestService_test_2_MethodParam(long id, int value){
        this.id = id;
        this.value= value;
    }
}
複製程式碼

複製程式碼

序列化的進一步優化

大部分 RPC 框架的序列化反序列化過程都需要一箇中間的 bytes

序列化過程：User > bytes > ByteBuf
反序列化過程：ByteBuf > bytes > User

而 Turbo 砍掉了中間的 bytes，直接操作 ByteBuf，實現了序列化反序列化的 zero-copy，大大減少了記憶體分配記憶體複製的開銷。具體實現請參考 ProtostuffSerializer 和 Codec。

對於已知型別和已知欄位，Turbo 都儘量採用手工序列化手工反序列化的方式來處理，以進一步減少效能開銷。

ObjectPool

常見的幾個 ObjectPool 實現效能都很差，反而很容易成為效能瓶頸。Stormpot 效能強悍，不過存在偶爾死鎖的問題，而且作者也停止維護了。HikariCP 效能不錯，不過其本身是一款資料庫連線池，用作 ObjectPool 並不稱手。我的建議是儘量避免使用 ObjectPool，轉而使用替代技術。更重要的是 Netty 的 Channel 是執行緒安全的，並不需要使用 ObjectPool 來管理。只需要一個簡單的容器來儲存 Channel，用的時候使用負載均衡策略選出一個 Channel 出來就行了。

framework thrpt (ops/us)

ThreadLocal	685.418
Stormpot	272.934
HikariCP	139.126
SegmentLock	19.415
Vibur	4.668
CommonsPool2	1.107
CommonsPool	0.276

基礎類庫優化

除了上述的關鍵流程優化，Turbo 還做了大量基礎類庫的優化

AtomicMuiltInteger 多個 int 的原子性操作
ConcurrentArrayList 無鎖併發 List 實現，比 CopyOnWriteArrayList 的寫入開銷低，O(1) vs O(n)
ConcurrentIntToObjectArrayMap 以 int 陣列為底層實現的無鎖併發 Map，讀多寫少情況下接近直接訪問欄位的效能，讀多寫多情況下是 ConcurrentHashMap 效能的 5x
ConcurrentIntegerSequencer 快速序號生成器，併發環境下是 AtomicInteger 效能的10x
ObjectId 全域性唯一 id 生成器，是 Java 自帶 UUID 效能的 200x
HexUtils 查表 + 批量操作，是 Netty 和 Guava 實現的 2x~5x
URLEncodeUtils 基於 HexUtils 實現，是 Java 和 Commons 實現的 2x，Guava 實現的 1.1x (Guava 只有 urlEncode 實現，無 urlDecode 實現)
ByteBufUtils 實現了高效的 ZigZag 寫入操作，最高可達通常實現的 4x

上面的內容僅介紹了作者認為重要的東西，更多內容請直接檢視 Turbo 原始碼

不足之處

有很多優化是毫無價值的，Donald Knuth 大神說得很對
強制必須使用 CompletableFuture 作為返回值導致了一些效能開銷
濫用 ClassGeneration，而且並沒有考慮類的解除安裝，這方面需要改進
實現了 UnsafeStringUtils，這是個危險的黑魔法實現，需要重新思考下
對效能的追求有點走火入魔，導致了很多地方的設計過於複雜

PyTorch最佳實踐，怎樣才能寫出一手風格優美的程式碼
2019-04-29
PyTorch
手寫RPC框架
2019-04-01
RPC框架
編寫 Netty / RPC 客戶端【框架程式碼分析】
2020-12-22
NettyRPC客戶端框架
編寫高效能的JavaScript
2019-02-23
JavaScript
基於netty手寫RPC框架
2019-11-07
NettyRPC框架
手寫RPC框架（六）整合Netty
2022-02-18
RPC框架Netty
仿照dubbo手寫一個RPC框架
2020-11-11
RPC框架
編寫高效能的Java程式碼
2019-05-14
Java
Java怎麼樣？學完後前途怎麼樣？
2021-10-15
Java
軟體測試工程師簡歷要怎麼寫，才能讓 HR 看到?
2020-09-27
工程師
怎麼樣才能學好Java！
2020-06-29
Java
怎麼樣才能挑到好茶葉？
2021-03-21
經驗之談：程式碼該怎樣寫才能乾淨整潔
2019-04-30
程式碼怎麼寫才能被面試官看上？小編帶你瞧瞧
2020-10-31
面試
網站要怎麼做才能有流量
2024-05-09
網站
計算機專業的學生要怎樣做才能避免成為低階的碼農？
2020-11-10
計算機
如何編寫一個高效能的Angular元件
2018-03-04
Angular元件
冴羽答讀者問：怎麼才能像你一樣寫文章如喝水？
2022-04-13
機器怎樣才能有意識
2018-08-16
怎樣實施RPA，才能事半功倍？
2020-06-04
怎樣才能快速掌握ps技術
2021-04-08
看了這篇你就會手寫RPC框架了
2020-07-24
RPC框架
一個生意不好的茶葉店要怎樣才能把生意做起來？泉州五久茶莊
2021-02-27
EA指令碼編寫要點
2018-05-29
指令碼
編寫高效能 Java 程式碼的最佳實踐
2018-06-20
Java
請問百度編輯器1.4.3的後端要怎麼寫？
2019-05-11
後端
究竟，怎樣才能算是“資深”工程師？
2021-12-30
工程師
編寫高效能React元件-傳值篇
2018-08-31
React元件
編寫一個非常精美的Flutter Todo-List專案
2019-07-29
Flutter
【萬字長文】Dubbo 入門總結，一款高效能的 Java RPC 框架
2020-12-07
JavaRPC框架
TARS為SpringCloud提供高效能的RPC能力
2021-09-09
SpringGCCloudRPC
怎樣才能給人工智慧注入有趣的靈魂？
2023-02-18
人工智慧
Swift編寫的EOS開源框架SwiftyEOS
2018-11-28
Swift框架
Python培訓教程分享：visual studio編寫python怎麼樣?
2021-11-25
Python
怎樣的懷舊才能滿足老玩家的情懷？
2019-07-04
怎樣做年終總結才能贏得領導歡心？掌握三個要點即可
2021-11-24
RPC框架是啥？
2019-04-20
RPC框架
RPC 框架設計
2021-03-18
RPC框架