JNI/NDK開發指南(9):JNI呼叫效能測試及優化

發表於2015-03-21

在前面幾章我們學習到了,在Java中宣告一個native方法,然後生成本地介面的函式原型宣告,再用C/C++實現這些函式,並生成對應平臺的動態共享庫放到Java程式的類路徑下,最後在Java程式中呼叫宣告的native方法就間接的呼叫到了C/C++編寫的函式了,在C/C++中寫的程式可以避開JVM的記憶體開銷過大的限制、處理高效能的計算、呼叫系統服務等功能。同時也學習到了在原生程式碼中通過JNI提供的介面,呼叫Java程式中的任意方法和物件的屬性。這是JNI提供的一些優勢。但做過Java的童鞋應該都明白,Java程式是執行在JVM上的,所以在Java中呼叫C/C++或其它語言這種跨語言的介面時,或者說在C/C++程式碼中通過JNI介面訪問Java中物件的方法或屬性時,相比Java呼叫自已的方法,效能是非常低的!!!網上有朋友針對Java呼叫本地介面,Java調Java方法做了一次詳細的測試,來充分說明在享受JNI給程式帶來優勢的同時,也要接受其所帶來的效能開銷,下面請看一組測試資料:

Java呼叫JNI空函式與Java呼叫Java空方法效能測試

測試環境:JDK1.4.2_19、JDK1.5.0_04和JDK1.6.0_14,測試的重複次數都是一億次。測試結果的絕對數值意義不大,僅供參考。因為根據JVM和機器效能的不同,測試所產生的數值也會不同,但不管什麼機器和JVM應該都能反應同一個問題,Java呼叫native介面,要比Java呼叫Java方法效能要低很多。

Java呼叫Java空方法的效能:

JDK版本 Java調Java耗時 平均每秒呼叫次數
1.6 329ms 303951367次
1.5 312ms 320512820次
1.4 312ms 27233115次

Java呼叫JNI空函式的效能:

JDK版本 Java調JNI耗時 平均每秒呼叫次數
1.6 1531ms 65316786次
1.5 1891ms 52882072次
1.4 3672ms 27233115次

從上述測試資料可以看出JDK版本越高,JNI呼叫的效能也越好。在JDK1.5中,僅僅是空方法呼叫,JNI的效能就要比Java內部呼叫慢將近5倍,而在JDK1.4下更是慢了十多倍。

JNI查詢方法ID、欄位ID、Class引用效能測試

當我們在原生程式碼中要訪問Java物件的欄位或呼叫它們的方法時,本機程式碼必須呼叫FindClass()、GetFieldID()、GetStaticFieldID、GetMethodID() 和 GetStaticMethodID()。對於 GetFieldID()、GetStaticFieldID、GetMethodID() 和 GetStaticMethodID(),為特定類返回的 ID 不會在 JVM 程式的生存期內發生變化。但是,獲取欄位或方法的呼叫有時會需要在 JVM 中完成大量工作,因為欄位和方法可能是從超類中繼承而來的,這會讓 JVM 向上遍歷類層次結構來找到它們。由於 ID 對於特定類是相同的,因此只需要查詢一次,然後便可重複使用。同樣,查詢類物件的開銷也很大,因此也應該快取它們。下面對呼叫JNI介面FindClass查詢Class、GetFieldID獲取類的欄位ID和GetFieldValue獲取欄位的值的效能做的一個測試。快取表示只呼叫一次,不快取就是每次都呼叫相應的JNI介面:

java.version = 1.6.0_14
JNI 欄位讀取 (快取Class=false ,快取欄位ID=false) 耗時 : 79172 ms 平均每秒 : 1263072
JNI 欄位讀取 (快取Class=true ,快取欄位ID=false) 耗時 : 25015 ms 平均每秒 : 3997601
JNI 欄位讀取 (快取Class=false ,快取欄位ID=true) 耗時 : 50765 ms 平均每秒 : 1969861
JNI 欄位讀取 (快取Class=true ,快取欄位ID=true) 耗時 : 2125 ms 平均每秒 : 47058823

java.version = 1.5.0_04
JNI 欄位讀取 (快取Class=false ,快取欄位ID=false) 耗時 : 87109 ms 平均每秒 : 1147987
JNI 欄位讀取 (快取Class=true ,快取欄位ID=false) 耗時 : 32031 ms 平均每秒 : 3121975
JNI 欄位讀取 (快取Class=false ,快取欄位ID=true) 耗時 : 51657 ms 平均每秒 : 1935846
JNI 欄位讀取 (快取Class=true ,快取欄位ID=true) 耗時 : 2187 ms 平均每秒 : 45724737

java.version = 1.4.2_19
JNI 欄位讀取 (快取Class=false ,快取欄位ID=false) 耗時 : 97500 ms 平均每秒 : 1025641
JNI 欄位讀取 (快取Class=true ,快取欄位ID=false) 耗時 : 38110 ms 平均每秒 : 2623983
JNI 欄位讀取 (快取Class=false ,快取欄位ID=true) 耗時 : 55204 ms 平均每秒 : 1811462
JNI 欄位讀取 (快取Class=true ,快取欄位ID=true) 耗時 : 4187 ms 平均每秒 : 23883448

根據上面的測試資料得知,查詢class和ID(屬性和方法ID)消耗的時間比較大。只是讀取欄位值的時間基本上跟上面的JNI空方法是一個數量級。而如果每次都根據名稱查詢class和field的話,效能要下降高達40倍。讀取一個欄位值的效能在百萬級上,在互動頻繁的JNI應用中是不能忍受的。 消耗時間最多的就是查詢class,因此在native裡儲存class和member id是很有必要的。class和member id在一定範圍內是穩定的,但在動態載入的class loader下,儲存全域性的class要麼可能失效,要麼可能造成無法解除安裝classloader,在諸如OSGI框架下的JNI應用還要特別注意這方面的問題。在讀取欄位值和查詢FieldID上,JDK1.4和1.5、1.6的差距是非常明顯的。但在最耗時的查詢class上,三個版本沒有明顯差距。

通過上面的測試可以明顯的看出,在呼叫JNI介面獲取方法ID、欄位ID和Class引用時,如果沒用使用快取的話,效能低至4倍。所以在JNI開發中,合理的使用快取技術能給程式提高極大的效能。快取有兩種,分別為使用時快取和類靜態初始化時快取,區別主要在於快取發生的時刻。

使用時快取

欄位ID、方法ID和Class引用在函式當中使用的同時就快取起來。下面看一個示例:

javah生成的標頭檔案:com_study_jnilearn_AccessCache.h

實現標頭檔案中的函式:AccessCache.c

例1、在Java_com_study_jnilearn_AccessCache_accessField函式中的第8行定義了一個靜態變數fid_str用於儲存欄位的ID,每次呼叫函式的時候,在第18行先判斷欄位ID是否已經快取,如果沒有先取出來存到fid_str中,下次再呼叫的時候該變數已經有值了,不用再去JVM中獲取,起到了快取的作用。

例2、在Java_com_study_jnilearn_AccessCache_newString函式中的53和54行定義了兩個變數cls_string和cid_string,分別用於儲存java.lang.String類的Class引用和String的構造方法ID。在56行和64行處,使用前會先判斷是否已經快取過,如果沒有則呼叫JNI的介面從JVM中獲取String的Class引用和構造方法ID儲存到靜態變數當中。下次再呼叫該函式時就可以直接使用,不需要再去找一次了,也達到了快取的效果。

類靜態初始化快取

在呼叫一個類的方法或屬性之前,Java虛擬機器會先檢查該類是否已經載入到記憶體當中,如果沒有則會先載入,然後緊接著會呼叫該類的靜態初始化程式碼塊,所以在靜態初始化該類的過程當中計算並快取該類當中的欄位ID和方法ID也是個不錯的選擇。下面看一個示例:

JVM載入AccessCache.class到記憶體當中之後,會呼叫該類的靜態初始化程式碼塊,即static程式碼塊,先呼叫System.loadLibrary載入動態庫到JVM中,緊接著呼叫native方法initIDs,會呼叫用到本地函式Java_com_study_jnilearn_AccessCache_initIDs,在該函式中獲取需要快取的ID,然後存入全域性變數當中。下次需要用到這些ID的時候,直接使用全域性變數當中的即可,如18行當中呼叫Java的callback函式。

兩種快取方式比較

如果在寫JNI介面時,不能控制方法和欄位所在類的原始碼的話,用使用時快取比較合理。但比起類靜態初始化時快取來說,用使用時快取有一些缺點:
1. 使用前,每次都需要檢查是否已經快取該ID或Class引用
2. 如果在用使用時快取的ID,要注意只要原生程式碼依賴於這個ID的值,那麼這個類就不會被unload。另外一方面,如果快取發生在靜態初始化時,當類被unload或reload時,ID會被重新計算。因為,儘量在類靜態初始化時就快取欄位ID、方法ID和類的Class引用。

相關文章