iOS編譯過程的原理和應用

LeoMobileDeveloper發表於2016-12-12

前言

一般可以將程式語言分為兩種,編譯語言和直譯式語言。

像C++,Objective C都是編譯語言。編譯語言在執行的時候,必須先通過編譯器生成機器碼,機器碼可以直接在CPU上執行,所以執行效率較高。

像JavaScript,Python都是直譯式語言。直譯式語言不需要經過編譯的過程,而是在執行的時候通過一箇中間的直譯器將程式碼解釋為CPU可以執行的程式碼。所以,較編譯語言來說,直譯式語言效率低一些,但是編寫的更靈活,也就是為啥JS大法好。

iOS開發目前的常用語言是:Objective和Swift。二者都是編譯語言,換句話說都是需要編譯才能執行的。二者的編譯都是依賴於Clang + LLVM. 篇幅限制,本文只關注Objective C,因為原理上大同小異。

可能會有同學想問,我不懂編譯的過程,寫程式碼也沒問題啊?這點我是不否定的。但是,充分理解了編譯的過程,會對你的開發大有幫助。本文的最後,會以以下幾個例子,來講解如何合理利用XCode和編譯

  • __attribute__
  • Clang警告處理
  • 預處理
  • 插入編譯期指令碼
  • 提高專案編譯速度

對於不想看我囉裡八嗦講一大堆原理的同學,可以直接跳到本文的最後一個章節。

iOS編譯

不管是OC還是Swift,都是採用Clang作為編譯器前端,LLVM(Low level vritual machine)作為編譯器後端。

編譯器前端

編譯器前端的任務是進行:語法分析,語義分析,生成中間程式碼(intermediate representation )。在這個過程中,會進行型別檢查,如果發現錯誤或者警告會標註出來在哪一行。

編譯器後端

編譯器後端會進行機器無關的程式碼優化,生成機器語言,並且進行機器相關的程式碼優化。

執行一次XCode build的流程

當你在XCode中,選擇build的時候(快捷鍵command+B),會執行如下過程

  • 編譯資訊寫入輔助檔案,建立編譯後的檔案架構(name.app)
  • 處理檔案打包資訊,例如在debug環境下
Entitlements:
{
    "application-identifier" = "app的bundleid";
    "aps-environment" = development;
}
  • 執行CocoaPod編譯前指令碼
    例如對於使用CocoaPod的工程會執行CheckPods Manifest.lock
  • 編譯各個.m檔案,使用CompileCclang命令。
CompileC ClassName.o ClassName.m normal x86_64 objective-c com.apple.compilers.llvm.clang.1_0.compiler
export LANG=en_US.US-ASCII
export PATH="..."
clang -x objective-c -arch x86_64 -fmessage-length=0 -fobjc-arc... -Wno-missing-field-initializers ... -DDEBUG=1 ... -isysroot iPhoneSimulator10.1.sdk -fasm-blocks ... -I 上文提到的檔案 -F 所需要的Framework  -iquote 所需要的Framework  ... -c ClassName.c -o ClassName.o

通過這個編譯的命令,我們可以看到

clang是實際的編譯命令
-x      objective-c 指定了編譯的語言
-arch   x86_64制定了編譯的架構,類似還有arm7等
-fobjc-arc 一些列-f開頭的,指定了採用arc等資訊。這個也就是為什麼你可以對單獨的一個.m檔案採用非ARC程式設計。
-Wno-missing-field-initializers 一系列以-W開頭的,指的是編譯的警告選項,通過這些你可以定製化編譯選項
-DDEBUG=1 一些列-D開頭的,指的是預編譯巨集,通過這些巨集可以實現條件編譯
-iPhoneSimulator10.1.sdk 制定了編譯採用的iOS SDK版本
-I 把編譯資訊寫入指定的輔助檔案
-F 連結所需要的Framework
-c ClassName.c 編譯檔案
-o ClassName.o 編譯產物
  • 連結需要的Framework,例如Foundation.framework,AFNetworking.framework,ALiPay.fframework
  • 編譯xib檔案
  • 拷貝xib,圖片等資原始檔到結果目錄
  • 編譯ImageAssets
  • 處理info.plist
  • 執行CocoaPod指令碼
  • 拷貝Swift標準庫
  • 建立.app檔案和對其簽名

IPA包的內容

例如,我們通過iTunes Store下載微信,然後獲得ipa安裝包,然後實際看看其安裝包的內容。

右鍵ipa,重新命名為.zip

雙擊zip檔案,解壓縮後會得到一個資料夾。所以,ipa包就是一個普通的壓縮包。

右鍵圖中的WeChat,選擇顯示包內容,然後就能夠看到實際的ipa包內容了。

二進位制檔案的內容

通過XCode的Link Map File,我們可以窺探二進位制檔案中佈局。

在XCode -> Build Settings -> 搜尋map -> 開啟Write Link Map File

開啟後,在編譯,我們可以在對應的Debug/Release目錄下看到對應的link map的text檔案。

預設的目錄在

~/Library/Developer/Xcode/DerivedData/<TARGET-NAME>-對應ID/Build/Intermediates/<TARGET-NAME>.build/Debug-iphoneos/<TARGET-NAME>.build/

例如,我的TargetName是EPlusPan4Phone,目錄如下

/Users/huangwenchen/Library/Developer/Xcode/DerivedData/EPlusPan4Phone-eznmxzawtlhpmadnbyhafnpqpizo/Build/Intermediates/EPlusPan4Phone.build/Debug-iphonesimulator/EPlusPan4Phone.build

這個對映檔案的主要包含以下部分:

Object files

這個部分包括的內容

- .o 文檔案,也就是上文提到的.m檔案編譯後的結果。
- .a檔案
- 需要link的framework

#! Arch: x86_64
#Object files:
[0] linker synthesized
[1] /EPlusPan4Phone.build/EPlusPan4Phone.app.xcent
[2]/EPlusPan4Phone.build/Objects-normal/x86_64/ULWBigResponseButton.o

[1175]/UMSocial_Sdk_4.4/libUMSocial_Sdk_4.4.a(UMSocialJob.o)
[1188]/iPhoneSimulator10.1.sdk/System/Library/Frameworks//Foundation.framework/Foundation

這個區域的儲存內容比較簡單:前面是檔案的編號,後面是檔案的路徑。檔案的編號在後續會用到

Sections

這個區域提供了各個段(Segment)和節(Section)在可執行檔案中的位置和大小。這個區域完整的描述克可執行檔案中的全部內容。

其中,段分為兩種

  • __TEXT 程式碼段
  • __DATA 資料段

例如,之前寫的一個App,Sections區域如下,可以看到,程式碼段的

__text節的地址是0x1000021B0,大小是0x0077EBC3,而二者相加的下一個位置正好是__stubs的位置0x100780D74。

# Sections:
# 位置       大小        段       節
# Address   Size        Segment Section
0x1000021B0 0x0077EBC3  __TEXT  __text //程式碼
0x100780D74 0x00000FD8  __TEXT  __stubs
0x100781D4C 0x00001A50  __TEXT  __stub_helper
0x1007837A0 0x0001AD78  __TEXT  __const //常量
0x10079E518 0x00041EF7  __TEXT  __objc_methname //OC 方法名
0x1007E040F 0x00006E34  __TEXT  __objc_classname //OC 類名
0x1007E7243 0x00010498  __TEXT  __objc_methtype  //OC 方法型別
0x1007F76DC 0x0000E760  __TEXT  __gcc_except_tab 
0x100805E40 0x00071693  __TEXT  __cstring  //字串
0x1008774D4 0x00004A9A  __TEXT  __ustring  
0x10087BF6E 0x00000149  __TEXT  __entitlements 
0x10087C0B8 0x0000D56C  __TEXT  __unwind_info 
0x100889628 0x000129C0  __TEXT  __eh_frame
0x10089C000 0x00000010  __DATA  __nl_symbol_ptr
0x10089C010 0x000012C8  __DATA  __got
0x10089D2D8 0x00001520  __DATA  __la_symbol_ptr
0x10089E7F8 0x00000038  __DATA  __mod_init_func
0x10089E840 0x0003E140  __DATA  __const //常量
0x1008DC980 0x0002D840  __DATA  __cfstring
0x10090A1C0 0x000022D8  __DATA  __objc_classlist // OC 方法列表
0x10090C498 0x00000010  __DATA  __objc_nlclslist 
0x10090C4A8 0x00000218  __DATA  __objc_catlist
0x10090C6C0 0x00000008  __DATA  __objc_nlcatlist
0x10090C6C8 0x00000510  __DATA  __objc_protolist // OC協議列表
0x10090CBD8 0x00000008  __DATA  __objc_imageinfo
0x10090CBE0 0x00129280  __DATA  __objc_const // OC 常量
0x100A35E60 0x00010908  __DATA  __objc_selrefs
0x100A46768 0x00000038  __DATA  __objc_protorefs 
0x100A467A0 0x000020E8  __DATA  __objc_classrefs 
0x100A48888 0x000019C0  __DATA  __objc_superrefs // OC 父類引用
0x100A4A248 0x0000A500  __DATA  __objc_ivar // OC iar
0x100A54748 0x00015CC0  __DATA  __objc_data
0x100A6A420 0x00007A30  __DATA  __data
0x100A71E60 0x0005AF70  __DATA  __bss
0x100ACCDE0 0x00053A4C  __DATA  __common

Symbols

Section部分將二進位制檔案進行了一級劃分。而,Symbols對Section中的各個段進行了二級劃分,例如,對於__TEXT __text,表示程式碼段中的程式碼內容。

0x1000021B0 0x0077EBC3  __TEXT  __text //程式碼

而對應的Symbols,起始地址也是0x1000021B0。其中,檔案編號和上文的編號對應

[2]/EPlusPan4Phone.build/Objects-normal/x86_64/ULWBigResponseButton.o

具體內容如下

# Symbols:
  地址     大小          檔案編號    方法名
# Address   Size        File       Name
0x1000021B0 0x00000109  [  2]     -[ULWBigResponseButton pointInside:withEvent:]
0x1000022C0 0x00000080  [  3]     -[ULWCategoryController liveAPI]
0x100002340 0x00000080  [  3]     -[ULWCategoryController categories]
....

到這裡,我們知道OC的方法是如何儲存的,我們再來看看ivar是如何儲存的。

首先找到資料棧中__DATA __objc_ivar

0x100A4A248 0x0000A500  __DATA  __objc_ivar

然後,搜尋這個地址0x100A4A248,就能找到ivar的儲存區域。

0x100A4A248 0x00000008  [  3] _OBJC_IVAR_$_ULWCategoryController._liveAPI

值得一提的是,對於String,會顯式的儲存到資料段中,例如,

0x1008065C2 0x00000029  [ 11] literal string: http://sns.whalecloud.com/sina2/callback

所以,若果你的加密Key以明文的形式寫在檔案裡,是一件很危險的事情。

dSYM 檔案

我們在每次編譯過後,都會生成一個dsym檔案。dsym檔案中,儲存了16進位制的函式地址對映。

在App實際執行的二進位制檔案中,是通過地址來呼叫方法的。在App crash的時候,第三方工具(Fabric,友盟等)會幫我們抓到崩潰的呼叫棧,呼叫棧裡會包含crash地址的呼叫資訊。然後,通過dSYM檔案,我們就可以由地址對映到具體的函式位置。

XCode中,選擇Window -> Organizer可以看到我們生成的archier檔案

然後,

右鍵 -> 在finder中顯示。

右鍵 -> 檢視包內容。

關於如何用dsym檔案來分析崩潰位置,可以檢視我之前的一篇部落格。

iOS 如何除錯第三方統計到的崩潰報告

那些你想到和想不到的應用場景

__attribute__

或多或少,你都會在第三方庫或者iOS的標頭檔案中,見到過attribute
比如

__attribute__ ((warn_unused_result)) //如果沒有使用返回值,編譯的時候給出警告

__attribtue__ 是一個高階的的編譯器指令,它允許開發者指定更更多的編譯檢查和一些高階的編譯期優化。

分為三種:

  • 函式屬性 (Function Attribute)
  • 型別屬性 (Variable Attribute )
  • 變數屬性 (Type Attribute )

語法結構

__attribute__ 語法格式為:__attribute__ ((attribute-list))

放在宣告分號“;”前面。

比如,在三方庫中最常見的,宣告一個屬性或者方法在當前版本棄用了

@property (strong,nonatomic)CLASSNAME * property __deprecated;

這樣的好處是:給開發者一個過渡的版本,讓開發者知道這個屬性被棄用了,應當使用最新的API,但是被__deprecated的屬性仍然可以正常使用。如果直接棄用,會導致開發者在更新Pod的時候,程式碼無法執行了。

__attribtue__的使用場景很多,本文只列舉iOS開發中常用的幾個:

//棄用API,用作API更新
#define __deprecated    __attribute__((deprecated)) 

//帶描述資訊的棄用
#define __deprecated_msg(_msg) __attribute__((deprecated(_msg)))

//遇到__unavailable的變數/方法,編譯器直接丟擲Error
#define __unavailable   __attribute__((unavailable))

//告訴編譯器,即使這個變數/方法 沒被使用,也不要丟擲警告
#define __unused    __attribute__((unused))

//和__unused相反
#define __used      __attribute__((used))

//如果不使用方法的返回值,進行警告
#define __result_use_check __attribute__((__warn_unused_result__))

//OC方法在Swift中不可用
#define __swift_unavailable(_msg)   __attribute__((__availability__(swift, unavailable, message=_msg)))

Clang警告處理

你一定還見過如下程式碼:

#pragma clang diagnostic push
#pragma clang diagnostic ignored "-Wundeclared-selector"
///程式碼
#pragma clang diagnostic pop

這段程式碼的作用是

  1. 對當前編譯環境進行壓棧
  2. 忽略-Wundeclared-selector(未宣告的)Selector警告
  3. 編譯程式碼
  4. 對編譯環境進行出棧

通過clang diagnostic push/pop,你可以靈活的控制程式碼塊的編譯選項。

我在之前的一篇文章裡,詳細的介紹了XCode的警告相關內容。本文篇幅限制,就不詳細講解了。

iOS 合理利用Clang警告來提高程式碼質量

預處理

所謂預處理,就是在編譯之前的處理。預處理能夠讓你定義編譯器變數,實現條件編譯。
比如,這樣的程式碼很常見

#ifdef DEBUG
//...
#else
//...
#endif

同樣,我們同樣也可以定義其他預處理變數,在XCode-選中Target-build settings中,搜尋proprecess。然後點選圖中藍色的加號,可以分別為debug和release兩種模式設定預處理巨集。
比如我們加上:TestServer,表示在這個巨集中的程式碼執行在測試伺服器

然後,配合多個Target(右鍵Target,選擇Duplicate),單獨一個Target負責測試伺服器。這樣我們就不用每次切換測試伺服器都要修改程式碼了。

#ifdef TESTMODE
//測試伺服器相關的程式碼
#else
//生產伺服器相關程式碼
#endif

插入指令碼

通常,如果你使用CocoaPod來管理三方庫,那麼你的Build Phase是這樣子的:

其中:[CP]開頭的,就是CocoaPod插入的指令碼。

  • Check Pods Manifest.lock,用來檢查cocoapod管理的三方庫是否需要更新
  • Embed Pods Framework,執行指令碼來連結三方庫的靜態/動態庫
  • Copy Pods Resources,執行指令碼來拷貝三方庫的資原始檔

而這些配置資訊都儲存在這個檔案(.xcodeprog)裡

到這裡,CocoaPod的原理也就大致搞清楚了,通過修改xcodeproject,然後配置編譯期指令碼,來保證三方庫能夠正確的編譯連線。

同樣,我們也可以插入自己的指令碼,來做一些額外的事情。比如,每次進行archive的時候,我們都必須手動調整target的build版本,如果一不小心,就會忘記。這個過程,我們可以通過插入指令碼自動化。

buildNumber=$(/usr/libexec/PlistBuddy -c "Print CFBundleVersion" "${PROJECT_DIR}/${INFOPLIST_FILE}")
buildNumber=$(($buildNumber + 1))
/usr/libexec/PlistBuddy -c "Set :CFBundleVersion $buildNumber" "${PROJECT_DIR}/${INFOPLIST_FILE}"

這段指令碼其實很簡單,讀取當前pist的build版本號,然後對其加一,重新寫入。

使用起來也很簡單:

Xcode – 選中Target – 選中build phase

選擇新增Run Script Phase

然後把這段指令碼拷貝進去,並且勾選Run Script Only When installing,保證只有我們在安裝到裝置上的時候,才會執行這段指令碼。重新命名指令碼的名字為Auto Increase build number

然後,拖動這個指令碼的到Link Binary With Libraries下面

指令碼編譯打包

指令碼化編譯打包對於CI(持續整合)來說,十分有用。iOS開發中,編譯打包必備的兩個命令是:

//編譯成.app
xcodebuild  -workspace $projectName.xcworkspace -scheme $projectName  -configuration $buildConfig clean build SYMROOT=$buildAppToDir
//打包
xcrun -sdk iphoneos PackageApplication -v $appDir/$projectName.app -o $appDir/$ipaName.ipa

通過info命令,可以檢視到詳細的文件
info xcodebuild

在本文最後的附錄中,提供了我之前使用的一個自動打包的指令碼。

提高專案編譯速度

通常,當專案很大,原始碼和三方庫引入很多的時候,我們會發現編譯的速度很慢。在瞭解了XCode的編譯過程後,我們可以從以下角度來優化編譯速度:

檢視編譯時間

我們需要一個途徑,能夠看到編譯的時間,這樣才能有個對比,知道我們的優化究竟有沒有效果。
對於XCode 8,關閉XCode,終端輸入以下指令

$ defaults write com.apple.dt.Xcode ShowBuildOperationDuration YES

然後,重啟XCode,然後編譯,你會在這裡看到編譯時間。

程式碼層面的優化

forward declaration

所謂forward declaration,就是@class CLASSNAME,而不是#import CLASSNAME.h。這樣,編譯器能大大提高#import的替換速度。

對常用的工具類進行打包(Framework/.a)

打包成Framework或者靜態庫,這樣編譯的時候這部分程式碼就不需要重新編譯了。

常用標頭檔案放到預編譯檔案裡

XCode的pch檔案是預編譯檔案,這裡的內容在執行XCode build之前就已經被預編譯,並且引入到每一個.m檔案裡了。

編譯器選項優化

Debug模式下,不生成dsym檔案

上文提到了,dysm檔案裡儲存了除錯資訊,在Debug模式下,我們可以藉助XCode和LLDB進行除錯。所以,不需要生成額外的dsym檔案來降低編譯速度。

Debug開啟Build Active Architecture Only

在XCode -> Build Settings -> Build Active Architecture Only 改為YES。這樣做,可以只編譯當前的版本,比如arm7/arm64等等,記得只開啟Debug模式。這個選項在高版本的XCode中自動開啟了。

Debug模式下,關閉編譯器優化

編譯器優化

後續

本來這篇文章還有很多內容想寫,篇幅限制,就先這樣吧。最近發生了很多不開心的事,這裡提醒自己一句:吃一塹,長一智。

後面有時間了,會介紹一些編譯期黑科技:

  • 寫入額外的編譯資訊
  • 函式的呼叫過程和執行時找到函式在二進位制檔案中的的地址
  • ……

附錄

自動編譯打包指令碼

export LC_ALL=zh_CN.GB2312;
export LANG=zh_CN.GB2312
buildConfig="Release" //這裡是build模式
projectName=`find . -name *.xcodeproj | awk -F "[/.]" '{print $(NF-1)}'`
projectDir=`pwd`
wwwIPADir=~/Desktop/$projectName-IPA
isWorkSpace=true
echo "~~~~~~~~~~~~~~~~~~~開始編譯~~~~~~~~~~~~~~~~~~~"
if [ -d "$wwwIPADir" ]; then
echo $wwwIPADir
echo "檔案目錄存在"
else
echo "檔案目錄不存在"
mkdir -pv $wwwIPADir
echo "建立${wwwIPADir}目錄成功"
fi
cd $projectDir
rm -rf ./build
buildAppToDir=$projectDir/build
infoPlist="$projectName/Info.plist"
bundleVersion=`/usr/libexec/PlistBuddy -c "Print CFBundleShortVersionString" $infoPlist`
bundleIdentifier=`/usr/libexec/PlistBuddy -c "Print CFBundleIdentifier" $infoPlist`
bundleBuildVersion=`/usr/libexec/PlistBuddy -c "Print CFBundleVersion" $infoPlist`

if $isWorkSpace ; then  #是否用CocoaPod
echo  "開始編譯workspace...."
xcodebuild  -workspace $projectName.xcworkspace -scheme $projectName  -configuration $buildConfig clean build SYMROOT=$buildAppToDir
else
echo  "開始編譯target...."
xcodebuild  -target  $projectName  -configuration $buildConfig clean build SYMROOT=$buildAppToDir
fi

if test $? -eq 0
then
echo "~~~~~~~~~~~~~~~~~~~編譯成功~~~~~~~~~~~~~~~~~~~"
else
echo "~~~~~~~~~~~~~~~~~~~編譯失敗~~~~~~~~~~~~~~~~~~~"
exit 1
fi

ipaName=`echo $projectName | tr "[:upper:]" "[:lower:]"` #將專案名轉小寫
findFolderName=`find . -name "$buildConfig-*" -type d |xargs basename` #查詢目錄
appDir=$buildAppToDir/$findFolderName/  #app所在路徑
echo "開始打包$projectName.app成$projectName.ipa....."
xcrun -sdk iphoneos PackageApplication -v $appDir/$projectName.app -o $appDir/$ipaName.ipa

if [ -f "$appDir/$ipaName.ipa" ]
then
echo "打包$ipaName.ipa成功."
else
echo "打包$ipaName.ipa失敗."
exit 1
fi

path=$wwwIPADir/$projectName$(date +%Y%m%d%H%M%S).ipa
cp -f -p $appDir/$ipaName.ipa $path   #拷貝ipa檔案
echo "複製$ipaName.ipa到${wwwIPADir}成功"
echo "~~~~~~~~~~~~~~~~~~~結束編譯,處理成功~~~~~~~~~~~~~~~~~~~"

相關文章