由Android 65K方法數限制引發的思考
前言
沒想到,65536真的很小。
Unable to execute dex: method ID not in [0, 0xffff]: 65536
PS:本文只是純探索一下這個65K的來源,僅此而已。
到底是65k還是64k?
都沒錯,同一個問題,不同的說法而已。
65536按1000算的話,是65k ~ 65 1000;
65536按1024算的話,是64k = 64 1024。
重點是65536=2^16,請大家記住這個數字。
時間點
65536是怎麼算出來的?
65536網上眾說紛紜,有對的,有不全對的,也有錯的。下面將跟蹤最新的AOSP原始碼來順藤摸瓜,但是探索問題必然迂迴冗餘,僅作記錄,讀者可直接跳過看結果。
1. 首先,查詢Dex的結構定義。
/* * Direct-mapped "header_item" struct. */ struct DexHeader { u1 magic[8]; u4 checksum; u1 signature[kSHA1DigestLen]; u4 fileSize; u4 headerSize; u4 endianTag; u4 linkSize; u4 linkOff; u4 mapOff; u4 stringIdsSize; u4 stringIdsOff; u4 typeIdsSize; u4 typeIdsOff; u4 protoIdsSize; u4 protoIdsOff; u4 fieldIdsSize; u4 fieldIdsOff; u4 methodIdsSize; // 這裡存放了方法欄位索引的大小,methodIdsSize的型別為u4 u4 methodIdsOff; u4 classDefsSize; u4 classDefsOff; u4 dataSize; u4 dataOff; };
u4的型別定義如下:
/* * These match the definitions in the VM specification. */ typedef uint8_t u1; typedef uint16_t u2; typedef uint32_t u4; typedef uint64_t u8; typedef int8_t s1; typedef int16_t s2; typedef int32_t s4; typedef int64_t s8;
進一步推出,methodIdsSize的型別是uint32_t,但它的限制為2^32 = 65536 * 65536,比65536大的多。
所以,65k不是dex檔案結構本身限制造成的。
PS:Dex檔案中儲存方法ID用的並不是short型別,無論最新的DexFile.h新定義的u4是uint32_t,還是老版本DexFile引用的vm/Common.h裡定義的u4是uint32或者unsigned int,都不是short型別,特此說明。
2. DexOpt優化造成?
這個說法源自:
當Android系統啟動一個應用的時候,有一步是對Dex進行優化,這個過程有一個專門的工具來處理,叫DexOpt。DexOpt的執行過程是在第一次載入Dex檔案的時候執行的。這個過程會生成一個ODEX檔案,即Optimised Dex。執行ODex的效率會比直接執行Dex檔案的效率要高很多。但是在早期的Android系統中,DexOpt有一個問題,也就是這篇文章想要說明並解決的問題。DexOpt會把每一個類的方法id檢索起來,存在一個連結串列結構裡面。但是這個連結串列的長度是用一個short型別來儲存的,導致了方法id的數目不能夠超過65536個。當一個專案足夠大的時候,顯然這個方法數的上限是不夠的。儘管在新版本的Android系統中,DexOpt修復了這個問題,但是我們仍然需要對老系統做相容。
鑑於我能力有限,沒有找到這塊邏輯對應的程式碼。
但我有個疑問,這個限制是在Android啟動一個應用的時候發生的,但從前面的“時間點”章節,65k問題是在構建的時候就發生了,還沒到啟動或者執行這一步。
我不敢否定這種說法,但說明65k至少還有其他地方限制。
3. DexMerger的檢測
只能在dalvik目錄下搜尋關鍵字”methid ID not in”,在DexMergger裡找到了丟擲異常的地方:
/** * Combine two dex files into one. */ public final class DexMerger { private void mergeMethodIds() { new IdMerger<MethodId>(idsDefsOut) { @Override TableOfContents.Section getSection(TableOfContents tableOfContents) { return tableOfContents.methodIds; } @Override MethodId read(Dex.Section in, IndexMap indexMap, int index) { return indexMap.adjust(in.readMethodId()); } @Override void updateIndex(int offset, IndexMap indexMap, int oldIndex, int newIndex) { if (newIndex < 0 || newIndex > 0xffff) { throw new DexIndexOverflowException( "method ID not in [0, 0xffff]: " + newIndex); } indexMap.methodIds[oldIndex] = (short) newIndex; } @Override void write(MethodId methodId) { methodId.writeTo(idsDefsOut); } }.mergeSorted(); } }
這裡定義了indexMap的methodIds的單項值要強轉short,所以在存放之前check一下範圍是不是0 ~ 0xffff。我們看看IndexMap的定義:
/** * Maps the index offsets from one dex file to those in another. For example, if * you have string #5 in the old dex file, its position in the new dex file is * {@code strings[5]}. */ public final class IndexMap { private final Dex target; public final int[] stringIds; public final short[] typeIds; public final short[] protoIds; public final short[] fieldIds; public final short[] methodIds; // ... ... }
看上去是對了,可是這個DexMerger是合併兩個dex的,預設情況下我們只有一個dex的,那麼這個65k是哪裡限制的呢?再查!
4. 迴歸DexFile
基本上前面基本是一個摸著石頭過河、反覆驗證網路說法的一個過程,雖然回想起來傻傻的,但是這種記錄還是有必要的。
前面看到DexFile的存放方法數大小的型別是uint32,但是根據後面的判斷,我們確定是打包的過程中產生了65k問題,所以我們得回過頭老老實實研究一下dx的打包流程。
… 此處省略分析流程5000字 …
OK,我把dx打包涉及到流程記錄下來:
// 原始碼目錄:dalvik/dx // Main.java -> main() -> run() -> runMonoDex()(或者runMultiDex()) -> writeDex() // DexFile -> toDex() -> toDex0() // MethodIdsSection extends MemberIdsSection extends UniformItemSection extends Section -> prepare() -> prepare0() -> orderItems() -> getTooManyMembersMessage() // Main.java -> getTooManyIdsErrorMessage()
最終狐狸的尾巴是在MemberIdsSection漏出來了:
package com.android.dx.dex.file; import com.android.dex.DexException; import com.android.dex.DexFormat; import com.android.dex.DexIndexOverflowException; import com.android.dx.command.dexer.Main; import java.util.Formatter; import java.util.Map; import java.util.TreeMap; import java.util.concurrent.atomic.AtomicInteger; /** * Member (field or method) refs list section of a {@code .dex} file. */ public abstract class MemberIdsSection extends UniformItemSection { /** * Constructs an instance. The file offset is initially unknown. * * @param name {@code null-ok;} the name of this instance, for annotation * purposes * @param file {@code non-null;} file that this instance is part of */ public MemberIdsSection(String name, DexFile file) { super(name, file, 4); } /** {@inheritDoc} */ @Override protected void orderItems() { int idx = 0; if (items().size() > DexFormat.MAX_MEMBER_IDX + 1) { throw new DexIndexOverflowException(getTooManyMembersMessage()); } for (Object i : items()) { ((MemberIdItem) i).setIndex(idx); idx++; } } private String getTooManyMembersMessage() { Map<String, AtomicInteger> membersByPackage = new TreeMap<String, AtomicInteger>(); for (Object member : items()) { String packageName = ((MemberIdItem) member).getDefiningClass().getPackageName(); AtomicInteger count = membersByPackage.get(packageName); if (count == null) { count = new AtomicInteger(); membersByPackage.put(packageName, count); } count.incrementAndGet(); } Formatter formatter = new Formatter(); try { String memberType = this instanceof MethodIdsSection ? "method" : "field"; formatter.format("Too many %s references: %d; max is %d.%n" + Main.getTooManyIdsErrorMessage() + "%n" + "References by package:", memberType, items().size(), DexFormat.MAX_MEMBER_IDX + 1); for (Map.Entry<String, AtomicInteger> entry : membersByPackage.entrySet()) { formatter.format("%n%6d %s", entry.getValue().get(), entry.getKey()); } return formatter.toString(); } finally { formatter.close(); } } }
裡面有一段:
// 如果方法數大於0xffff就提示65k錯誤 if (items().size() > DexFormat.MAX_MEMBER_IDX + 1) { throw new DexIndexOverflowException(getTooManyMembersMessage()); } // 這個DexFormat.MAX_MEMBER_IDX就是0xFFFF /** * Maximum addressable field or method index. * The largest addressable member is 0xffff, in the "instruction formats" spec as field@CCCC or * meth@CCCC. */ public static final int MAX_MEMBER_IDX = 0xFFFF;
至此,真相大白!
5. 根本原因
為什麼定義DexFormat.MAX_MEMBER_IDX為0xFFFF?
雖然我們找到了65k報錯的地方,但是為什麼程式中方法數超過0xFFFF就要報錯呢?
通過搜尋”instruction formats”, 我最終查到了Dalvik VM Bytecode,找到最新的官方說明:
https://source.android.com/devices/tech/dalvik/dalvik-bytecode.html
裡面說明了上面的@CCCC的範圍必須在0~65535之間,這是dalvik bytecode的限制。
所以,65536是bytecode的16位限制算出來的:2^16。
PS:以上分析得到群裡很多朋友的討論和幫忙。
6. 回顧
我好像明白了什麼:
- 65k問題是dx打包單個Dex時報的錯,所以只要用dx打包單個dex就可能有這個問題。
- 不僅方法數,欄位數也有65k問題。
- 目前來說,65k問題和系統無關。
- 目前來說,65k問題和art無關。
- 即使分包MultiDex,當主Dex的方法數超過65k依然會報錯。
- MultiDex方案不是從根本上解決了65k問題,但是大大緩解甚至說基本解決了65k問題。
新的Jack能否解決65k問題?
據說Jack的方式把class打包成.jack檔案。所以我認為,Jack具備解決65k問題的條件:
- 打包:新的jack檔案肯定是拋棄了dalvik的相容性,這也註定我們們這兩年可能還用不了。
- 虛擬機器:完全採用新的ART虛擬機器,把class轉化成本地機器碼,就能避開dalvik bytecode的16位限制。
- 上面兩條屬於廢話,說白了,完全不用dalvik虛擬機器了,同時也就完全不用dx了,如此,當然就不存在65k問題了。
以上純屬我個人推測,一切以科學分析為準。
相關文章
- 由一個emoji引發的思考
- 由Object.prototype.toString.call( )引發關於toString( )方法的思考Object
- 由mv命令引發的對inode的思考
- 【高併發】由InterruptedException異常引發的思考Exception
- 由屎色自行車棚引發的思考
- 由Siri和Alexa結婚引發的思考
- 由 LG P4309 引發的擴充思考
- iOS開發基礎149-由UUIDString引發的思考iOSUI
- 由setContentView()方法引起的思考View
- 一個由line-height引發的血案與思考
- 由select for update鎖等待問題引發的深入思考
- 由script標籤引發了我對setTimeout非同步的思考非同步
- 由《暗黑地牢》這款「地主模擬器」引發的思考
- 由ASP.NET Core讀取Response.Body引發的思考ASP.NET
- 由引數URL想到的
- JS學習筆記之由定時器引發的深入思考JS筆記定時器
- 一場由React引發的前後端分離架構的思考React後端架構
- Android 突破 DEX 檔案的 64K 方法數限制Android
- 交換2個整形數引發的思考
- 一個bug引發的Android分割槽儲存的思考Android
- for...in引發的思考
- 口碑割裂,內憂外患 由《最後生還者2》引發的思考
- 由於一次內聯元素錯位引發的line-height思考
- 電梯引發的思考
- 由Ghost漏洞引發的“血案”
- 淺談雙人遊戲的設計與魅力——由《雙人成行》引發的思考遊戲
- Flutter 中由 BuildContext 引發的血案FlutterUIContext
- 定時器引發的思考定時器
- 一個commit引發的思考MIT
- 由一次安全掃描引發的思考:如何保障 API 介面的安全性?API
- 部門老大的發言引發的思考
- 由OGG引發的資料庫故障資料庫
- 限制併發數
- python中關鍵字引數的個數有限制嗎?Python
- 首頁白屏的引發的思考(一)
- 由引數檔案配置表對映重複引發的OGG-01154 ORA-00001
- 由節流函式引發出我對event-loop的思考,順便刷刷爆款題函式OOP
- ts中如何限制方法傳入的引數data必須是陣列,且為偶數項?陣列
- 【深度思考】如何優雅的校驗引數?