應用啟動型別
- 冷啟動
場景:開機後第一次啟動應用 或者 應用被殺死後再次啟動生命週期:Process.start->Application建立->attachBaseContext->onCreate->onStart->onResume->Activity生命週期啟動速度:在幾種啟動型別中最慢,也是我們優化啟動速度最大的攔路虎
- 溫啟動
場景:應用已經啟動,返回鍵退出生命週期:onCreate->onStart->onResume->Activity生命週期啟動速度:較快
- 熱啟動
場景:Home鍵最小化應用生命週期:onResume->Activity生命週期啟動速度:快
從上面的總結可以看出,在應用的啟動過程中,冷啟動是最慢最耗時的,系統以及應用本身都有大量的工作需要處理,所以,冷啟動對於應用的啟動速度是最具挑戰以及最有必要進行優化的。
冷啟動流程
冷啟動指的是應用程式從程式在系統不存在,到系統建立應用執行程式空間的過程。冷啟動通常會發生在一下兩種情況:
- 裝置啟動以來首次啟動應用程式
- 系統殺死應用程式之後再次啟動應用程式
在冷啟動的最開始,系統需要負責做三件事:
- 載入以及啟動app
- app啟動之後立刻顯示一個空白的預覽視窗
- 建立app程式
一旦系統完成建立app程式後,app程式將要接著負責完成下面的工作:
- 建立Application物件
- 建立並且啟動主執行緒ActivityThread
- 建立啟動第一個Activity
- Inflating views
- 佈局螢幕
- 執行第一次繪製
一旦app程式完完成了第一次繪製工作,系統程式就會用main activity替換前面顯示的預覽視窗,這個時候,使用者就可以正式開始與app進行互動了。
從冷啟動的流程看,我們無法干預app程式建立等系統操作,我們能夠干預的有:
-
預覽視窗
-
Application生命週期回撥
-
Activity生命週期回撥
測量應用啟動時間工具
- adb shell am start -W [packageName]/[ packageName. AppstartActivity]
在統計 app 啟動時間時,系統為我們提供了 adb 命令,可以輸出啟動時間。系統在繪製完成後,ActivityManagerService 會回撥該方法,但是能夠方便我們通過指令碼多次啟動測量 TotalTime,對比版本間啟動時間差異。但是統計時間不如 Systrace 準確。
- 程式碼埋點
通過程式碼埋點來準確獲取記錄每個方法的執行時間,知道哪些地方耗時,然後再有針對性地優化。例如通過在 app 啟動生命週期中,關鍵位置加入時間點記錄,達到測量目的;又例如可以在 Application 的 attachBaseContext方法中記錄開始時間,然後在啟動的第一個 Activity 的 onWindowFocusChanged方法記錄結束時間。但是從使用者點選 app Icon 到 Application 被建立,再到 Activity 的渲染,中間還是有很多步驟的,比如冷啟動的程式建立過程,而這個時間用此版本是沒辦法統計了,必須得承受這點資料的不準確性。
- Nanoscope
Nanoscope 非常真實,不過暫時只支援 Nexus 6 和 x86 模擬器。
- Simpleperf
Simpleperf 的火焰圖並不適合做啟動流程分析。
- TraceView
通過 TraceView 主要可以得到兩種資料:單次執行耗時的方法 以及 執行次數多的方法。但是TraceView 效能耗損太大,不能比較正確反映真實情況。
- Systrace
Systrace 能夠追蹤關鍵系統呼叫的耗時情況,如系統的 IO 操作、核心工作佇列、CPU 負載、Surface 渲染、GC 事件以及 Android 各個子系統的執行狀況等。但是不支援應用程式程式碼的耗時分析。
- “Systrace + 函式插樁”
除了能夠看到例如 GC、System Server、CPU 排程等系統呼叫的耗時,還能夠通過 Android 工程編譯的過程中,在指定的方法前後,自動化插入插樁函式,統計方法執行時間。通過插樁,我們可以看到應用主執行緒和其他執行緒的函式呼叫流程。它的實現原理非常簡單,就是將下面的兩個函式 通過用ASM框架修改位元組碼的方式分別插入到每個方法的入口和出口。
class TraceMethod {
public static void i() {
Trace.beginSection();
}
public static void o() {
Trace.endSection();
}
}
複製程式碼
當然這裡面有非常多的細節需要考慮,比如怎麼樣降低插樁對效能的影響、哪些函式需要被排除掉。函式插樁後的效果如下:
class Test {
public void test() {
TraceMethod.i();
// 原來的工作
TraceMethod.o();
}
}
複製程式碼
啟動優化方法
- 預覽視窗優化
當使用者點選應用桌面圖示啟動應用的時候,利用提前展示出來的 Window,快速展示出一個介面,使用者只需要很短的時間就可以看到“預覽頁”,這種完全“跟手”的感覺在高階機上體驗非常好,但對於中低端機,會把總的的閃屏時間變得更長。如果點選圖示沒有響應,使用者主觀上會認為是手機系統響應比較慢。所以比較推薦的做法是,只在 Android 6.0 或者 Android 7.0 以上才啟用“預覽視窗”方案,讓手機效能好的使用者可以有更好的體驗。要實現預覽視窗的顯示,只需要在利用 activity 的windowBackground主題屬性提供一個簡單的自定義 drawable 給啟動的 activity,如下:Layout XML file:
<layer-list xmlns:android="http://schemas.android.com/apk/res/android" android:opacity="opaque">
<!-- The background color, preferably the same as your normal theme -->
<item android:drawable="@android:color/white"/>
<!-- Your product logo - 144dp color version of your app icon -->
<item>
<bitmap
android:src="@drawable/product_logo_144dp"
android:gravity="center"/>
</item>
</layer-list>
複製程式碼
Manifest file:
<activity ...
android:theme="@style/AppTheme.Launcher" />
複製程式碼
這樣一個 activity 啟動的時候,就會先顯示一個預覽視窗,給使用者快速響應的體驗。當 activity想要恢復原來 theme,可以通過在呼叫super.onCreate() 和setContentView()之前呼叫 setTheme(R.style.AppTheme),如下:
public class MyMainActivity extends AppCompatActivity {
@Override
protected void onCreate(Bundle savedInstanceState) {
// Make sure this is before calling super.onCreate
setTheme(R.style.Theme_MyApp);
super.onCreate(savedInstanceState);
// ...
}
}
複製程式碼
- 業務梳理
不要一股腦把全部初始化工作放在 Application 中做,需要梳理清楚當前啟動過程正在執行的每一個模組,哪些是一定需要的、哪些可以砍掉、哪些可以懶載入。但是需要注意的是,懶載入要防止集中化,否則容易出現首頁顯示後使用者無法操作的情形。總的來說,用以下四個維度分整理啟動的各個點:
- 必要且耗時:啟動初始化,考慮用執行緒來初始化。
- 必要不耗時:首頁繪製。
- 非必要但耗時:資料上報、外掛初始化。
- 非必要不耗時:不用想,這塊直接去掉,在需要用的時再載入。
把資料整理出來後,按需實現載入邏輯,採取分步載入、非同步載入、延期載入策略,如下圖所示:
- 業務優化
通過梳理之後,剩下的都是啟動過程一定要用的模組。這個時候,我們只能硬著頭皮去做進一步的優化。優化前期需要“抓大放小”,先看看主執行緒究竟慢在哪裡。最理想是通過演算法進行優化,例如一個資料解密操作需要 1 秒,通過演算法優化之後變成 10 毫秒。退而求其次,我們要考慮這些任務是不是可以通過非同步執行緒預載入實現,但需要注意的是過多的執行緒預載入會讓我們的邏輯變得更加複雜。
- 多程式優化
Android app 是支援多程式的,在 Manifest 中只要在元件宣告中加入android:process屬性就可以讓元件在啟動時執行在不同的程式中。舉個例子: 對於多程式 app ,可能擁有主程式,外掛程式以及下載程式,但開發者只能在Manifest 中宣告一個 Application 元件,如果對應不同程式的元件啟動時,系統會建立三個程式,建立三個 Application 物件,同時attachBaseContext、onCreate等生命週期回撥方法也會被呼叫三次。但是每個程式需要初始化的內容肯定是不一樣的,所以,為了防止資源的浪費,我們需要在Application 中區分程式,對應程式只初始化對應的內容。
- 執行緒優化線
程優化分兩方面:第一,耗時任務非同步化。子執行緒處理耗時任務,主執行緒做的事情越少,越早進入Acitivity繪製階段,介面越早展現。例如不在主執行緒做如 IO 、網路等耗時操作。但是要注意,子執行緒不能阻塞主執行緒。第二,執行緒池管理執行緒,控制執行緒的數量。執行緒數量太多會相互競爭 CPU 資源,導致分給主執行緒的時間片減少,從而導致啟動速度變慢。執行緒切換的資料我們可以通過卡頓優化中學到的 sched 檔案檢視,這裡特別需要注意 nr_involuntary_switches 被動切換的次數。
proc/[pid]/sched:
nr_voluntary_switches:主動上下文切換次數,因為執行緒無法獲取所需資源導致上下文切換,最普遍的是 IO。
nr_involuntary_switches:被動上下文切換次數,執行緒被系統強制排程導致上下文切換,例如大量執行緒在搶佔 CPU。
複製程式碼
第三,避免主執行緒與子執行緒之間的鎖阻塞等待。有一次我們把主執行緒內的一個耗時任務放到執行緒中併發執行,但是發現這樣做根本沒起作用。仔細檢查後發現執行緒內部會持有一個鎖,主執行緒很快就有其他任務因為這個鎖而等待。通過 Systrace 可以看到鎖等待的事件,我們需要排查這些等待是否可以優化,特別是防止主執行緒出現長時間的空轉。
特別是現在有很多啟動框架,會使用 Pipeline 機制,根據業務優先順序規定業務初始化時機。比如微信內部使用的 mmkernel 、阿里最近開源的 Alpha 啟動框架,它們為各個任務建立依賴關係,最終構成一個有向無環圖。對於可以併發的任務,會通過執行緒池最大程度提升啟動速度。如果任務的依賴關係沒有配置好,很容易出現下圖這種情況,即主執行緒會一直等待 taskC 結束,空轉 2950 毫秒。
第四,設定子執行緒優先順序。不重要任務,設定子執行緒優先順序為 THREAD_PRIORITY_BACKGROUND,這樣子執行緒最多能獲取到10%的時間片,優先保證主執行緒執行。
- GC優化
在啟動過程,要儘量減少 GC 的次數,避免造成主執行緒長時間的卡頓,特別是對 Dalvik 來說,我們可以通過 Systrace 單獨檢視整個啟動過程 GC 的時間。啟動過程避免進行大量的字串操作,特別是序列化跟反序列化過程。一些頻繁建立的物件,例如網路庫和圖片庫中的 Byte 陣列、Buffer 可以複用。如果一些模組實在需要頻繁建立物件,可以考慮移到 Native 實現。Java 物件的逃逸也很容易引起 GC 問題,我們在寫程式碼的時候比較容易忽略這個點。我們應該保證物件生命週期儘量的短,在棧上就進行銷燬。
- 系統呼叫優化
部分系統的API使用是阻塞性的,檔案很小可能無法感知,當檔案過大,或者使用頻繁時,可能造成阻塞。例如:SharedPreference.Editor 的提交操作建議使用非同步的 apply,而不是阻塞的 commit。通過 systrace 的 System Service 型別,我們可以看到啟動過程 System Server 的CPU 工作情況。在啟動過程,我們儘量不要做系統呼叫,例如 PackageManagerService 操作、Binder 呼叫等待。在啟動過程也不要過早地拉起應用的其他程式,System Server 和新的程式都會競爭 CPU 資源。特別是系統記憶體不足的時候,當我們拉起一個新的程式,可能會成為“壓死駱駝的最後一根稻草”。它可能會觸發系統的 low memorykiller 機制,導致系統殺死和拉起(保活)大量的程式,從而影響前臺程式的 CPU。
- 佈局優化 佈局越複雜,測量佈局繪製的時間就越長。主要做到以下幾點:佈局的層級越少,載入速度越快。一個控制元件的屬性越少,解析越快,刪除控制元件中的無用屬性。使用標籤載入一些不常用的佈局,做到使用時在載入。使用標籤減少佈局的巢狀層次。儘可能少用wrap_content,wrap_content會增加布局measure時的計算成本,已知寬高為固定值時,不用wrap_content。
主要注意以下幾個事項:
儘量避免啟動時在主執行緒做密集繁重的工作,如:避免 I/O 操作、反序列化、網路操作、鎖等待等。
對模組以及第三方庫按需載入,採取分步載入、非同步載入、延期載入等策略。
利用執行緒池管理執行緒,避免建立大量執行緒,造成 CPU 競爭,導致主執行緒時間片減少。
啟動過程中,儘量避免頻繁建立的大量物件,減少 GC 給啟動效能帶來的卡頓影響。
儘量避免在啟動過程中呼叫阻塞性的系統呼叫。