iOS編譯過程的原理和應用
前言
一般可以將程式語言分為兩種,編譯語言和直譯式語言。
像C++,Objective C都是編譯語言。編譯語言在執行的時候,必須先通過編譯器生成機器碼,機器碼可以直接在CPU上執行,所以執行效率較高。
像JavaScript,Python都是直譯式語言。直譯式語言不需要經過編譯的過程,而是在執行的時候通過一箇中間的直譯器將程式碼解釋為CPU可以執行的程式碼。所以,較編譯語言來說,直譯式語言效率低一些,但是編寫的更靈活,也就是為啥JS大法好。
iOS開發目前的常用語言是:Objective和Swift。二者都是編譯語言,換句話說都是需要編譯才能執行的。二者的編譯都是依賴於Clang + LLVM. 篇幅限制,本文只關注Objective C,因為原理上大同小異。
可能會有同學想問,我不懂編譯的過程,寫程式碼也沒問題啊?這點我是不否定的。但是,充分理解了編譯的過程,會對你的開發大有幫助。本文的最後,會以以下幾個例子,來講解如何合理利用XCode和編譯
__attribute__
- Clang警告處理
- 預處理
- 插入編譯期指令碼
- 提高專案編譯速度
對於不想看我囉裡八嗦講一大堆原理的同學,可以直接跳到本文的最後一個章節。
iOS編譯
不管是OC還是Swift,都是採用Clang作為編譯器前端,LLVM(Low level vritual machine)作為編譯器後端。
編譯器前端
編譯器前端的任務是進行:語法分析,語義分析,生成中間程式碼(intermediate representation )。在這個過程中,會進行型別檢查,如果發現錯誤或者警告會標註出來在哪一行。
編譯器後端
編譯器後端會進行機器無關的程式碼優化,生成機器語言,並且進行機器相關的程式碼優化。
執行一次XCode build的流程
當你在XCode中,選擇build的時候(快捷鍵command+B),會執行如下過程
- 編譯資訊寫入輔助檔案,建立編譯後的檔案架構(name.app)
- 處理檔案打包資訊,例如在debug環境下
Entitlements: { "application-identifier" = "app的bundleid"; "aps-environment" = development; }
- 執行CocoaPod編譯前指令碼
例如對於使用CocoaPod的工程會執行CheckPods Manifest.lock
- 編譯各個.m檔案,使用
CompileC
和clang
命令。
CompileC ClassName.o ClassName.m normal x86_64 objective-c com.apple.compilers.llvm.clang.1_0.compiler export LANG=en_US.US-ASCII export PATH="..." clang -x objective-c -arch x86_64 -fmessage-length=0 -fobjc-arc... -Wno-missing-field-initializers ... -DDEBUG=1 ... -isysroot iPhoneSimulator10.1.sdk -fasm-blocks ... -I 上文提到的檔案 -F 所需要的Framework -iquote 所需要的Framework ... -c ClassName.c -o ClassName.o
通過這個編譯的命令,我們可以看到
clang是實際的編譯命令 -x objective-c 指定了編譯的語言 -arch x86_64制定了編譯的架構,類似還有arm7等 -fobjc-arc 一些列-f開頭的,指定了採用arc等資訊。這個也就是為什麼你可以對單獨的一個.m檔案採用非ARC程式設計。 -Wno-missing-field-initializers 一系列以-W開頭的,指的是編譯的警告選項,通過這些你可以定製化編譯選項 -DDEBUG=1 一些列-D開頭的,指的是預編譯巨集,通過這些巨集可以實現條件編譯 -iPhoneSimulator10.1.sdk 制定了編譯採用的iOS SDK版本 -I 把編譯資訊寫入指定的輔助檔案 -F 連結所需要的Framework -c ClassName.c 編譯檔案 -o ClassName.o 編譯產物
- 連結需要的Framework,例如
Foundation.framework
,AFNetworking.framework
,ALiPay.fframework
- 編譯xib檔案
- 拷貝xib,圖片等資原始檔到結果目錄
- 編譯ImageAssets
- 處理info.plist
- 執行CocoaPod指令碼
- 拷貝Swift標準庫
- 建立.app檔案和對其簽名
IPA包的內容
例如,我們通過iTunes Store下載微信,然後獲得ipa安裝包,然後實際看看其安裝包的內容。
右鍵ipa,重新命名為.zip
雙擊zip檔案,解壓縮後會得到一個資料夾。所以,ipa包就是一個普通的壓縮包。
右鍵圖中的WeChat
,選擇顯示包內容,然後就能夠看到實際的ipa包內容了。
二進位制檔案的內容
通過XCode的Link Map File,我們可以窺探二進位制檔案中佈局。
在XCode -> Build Settings -> 搜尋map -> 開啟Write Link Map File
開啟後,在編譯,我們可以在對應的Debug/Release目錄下看到對應的link map的text檔案。
預設的目錄在
~/Library/Developer/Xcode/DerivedData/<TARGET-NAME>-對應ID/Build/Intermediates/<TARGET-NAME>.build/Debug-iphoneos/<TARGET-NAME>.build/
例如,我的TargetName是EPlusPan4Phone
,目錄如下
/Users/huangwenchen/Library/Developer/Xcode/DerivedData/EPlusPan4Phone-eznmxzawtlhpmadnbyhafnpqpizo/Build/Intermediates/EPlusPan4Phone.build/Debug-iphonesimulator/EPlusPan4Phone.build
這個對映檔案的主要包含以下部分:
Object files
這個部分包括的內容
- .o 文檔案,也就是上文提到的.m檔案編譯後的結果。
- .a檔案
- 需要link的framework
#! Arch: x86_64
#Object files:
[0] linker synthesized
[1] /EPlusPan4Phone.build/EPlusPan4Phone.app.xcent
[2]/EPlusPan4Phone.build/Objects-normal/x86_64/ULWBigResponseButton.o
…
[1175]/UMSocial_Sdk_4.4/libUMSocial_Sdk_4.4.a(UMSocialJob.o)
[1188]/iPhoneSimulator10.1.sdk/System/Library/Frameworks//Foundation.framework/Foundation
這個區域的儲存內容比較簡單:前面是檔案的編號,後面是檔案的路徑。檔案的編號在後續會用到
Sections
這個區域提供了各個段(Segment)和節(Section)在可執行檔案中的位置和大小。這個區域完整的描述克可執行檔案中的全部內容。
其中,段分為兩種
- __TEXT 程式碼段
- __DATA 資料段
例如,之前寫的一個App,Sections區域如下,可以看到,程式碼段的
__text節的地址是0x1000021B0,大小是0x0077EBC3,而二者相加的下一個位置正好是__stubs的位置0x100780D74。
# Sections: # 位置 大小 段 節 # Address Size Segment Section 0x1000021B0 0x0077EBC3 __TEXT __text //程式碼 0x100780D74 0x00000FD8 __TEXT __stubs 0x100781D4C 0x00001A50 __TEXT __stub_helper 0x1007837A0 0x0001AD78 __TEXT __const //常量 0x10079E518 0x00041EF7 __TEXT __objc_methname //OC 方法名 0x1007E040F 0x00006E34 __TEXT __objc_classname //OC 類名 0x1007E7243 0x00010498 __TEXT __objc_methtype //OC 方法型別 0x1007F76DC 0x0000E760 __TEXT __gcc_except_tab 0x100805E40 0x00071693 __TEXT __cstring //字串 0x1008774D4 0x00004A9A __TEXT __ustring 0x10087BF6E 0x00000149 __TEXT __entitlements 0x10087C0B8 0x0000D56C __TEXT __unwind_info 0x100889628 0x000129C0 __TEXT __eh_frame 0x10089C000 0x00000010 __DATA __nl_symbol_ptr 0x10089C010 0x000012C8 __DATA __got 0x10089D2D8 0x00001520 __DATA __la_symbol_ptr 0x10089E7F8 0x00000038 __DATA __mod_init_func 0x10089E840 0x0003E140 __DATA __const //常量 0x1008DC980 0x0002D840 __DATA __cfstring 0x10090A1C0 0x000022D8 __DATA __objc_classlist // OC 方法列表 0x10090C498 0x00000010 __DATA __objc_nlclslist 0x10090C4A8 0x00000218 __DATA __objc_catlist 0x10090C6C0 0x00000008 __DATA __objc_nlcatlist 0x10090C6C8 0x00000510 __DATA __objc_protolist // OC協議列表 0x10090CBD8 0x00000008 __DATA __objc_imageinfo 0x10090CBE0 0x00129280 __DATA __objc_const // OC 常量 0x100A35E60 0x00010908 __DATA __objc_selrefs 0x100A46768 0x00000038 __DATA __objc_protorefs 0x100A467A0 0x000020E8 __DATA __objc_classrefs 0x100A48888 0x000019C0 __DATA __objc_superrefs // OC 父類引用 0x100A4A248 0x0000A500 __DATA __objc_ivar // OC iar 0x100A54748 0x00015CC0 __DATA __objc_data 0x100A6A420 0x00007A30 __DATA __data 0x100A71E60 0x0005AF70 __DATA __bss 0x100ACCDE0 0x00053A4C __DATA __common
Symbols
Section部分將二進位制檔案進行了一級劃分。而,Symbols對Section中的各個段進行了二級劃分,例如,對於__TEXT __text
,表示程式碼段中的程式碼內容。
0x1000021B0 0x0077EBC3 __TEXT __text //程式碼
而對應的Symbols
,起始地址也是0x1000021B0
。其中,檔案編號和上文的編號對應
[2]/EPlusPan4Phone.build/Objects-normal/x86_64/ULWBigResponseButton.o
具體內容如下
# Symbols: 地址 大小 檔案編號 方法名 # Address Size File Name 0x1000021B0 0x00000109 [ 2] -[ULWBigResponseButton pointInside:withEvent:] 0x1000022C0 0x00000080 [ 3] -[ULWCategoryController liveAPI] 0x100002340 0x00000080 [ 3] -[ULWCategoryController categories] ....
到這裡,我們知道OC的方法是如何儲存的,我們再來看看ivar是如何儲存的。
首先找到資料棧中__DATA __objc_ivar
0x100A4A248 0x0000A500 __DATA __objc_ivar
然後,搜尋這個地址0x100A4A248
,就能找到ivar的儲存區域。
0x100A4A248 0x00000008 [ 3] _OBJC_IVAR_$_ULWCategoryController._liveAPI
值得一提的是,對於String,會顯式的儲存到資料段中,例如,
0x1008065C2 0x00000029 [ 11] literal string: http://sns.whalecloud.com/sina2/callback
所以,若果你的加密Key以明文的形式寫在檔案裡,是一件很危險的事情。
dSYM 檔案
我們在每次編譯過後,都會生成一個dsym檔案。dsym檔案中,儲存了16進位制的函式地址對映。
在App實際執行的二進位制檔案中,是通過地址來呼叫方法的。在App crash的時候,第三方工具(Fabric,友盟等)會幫我們抓到崩潰的呼叫棧,呼叫棧裡會包含crash地址的呼叫資訊。然後,通過dSYM檔案,我們就可以由地址對映到具體的函式位置。
XCode中,選擇Window -> Organizer可以看到我們生成的archier檔案
然後,
右鍵 -> 在finder中顯示。
右鍵 -> 檢視包內容。
關於如何用dsym檔案來分析崩潰位置,可以檢視我之前的一篇部落格。
那些你想到和想不到的應用場景
__attribute__
或多或少,你都會在第三方庫或者iOS的標頭檔案中,見到過attribute。
比如
__attribute__ ((warn_unused_result)) //如果沒有使用返回值,編譯的時候給出警告
__attribtue__
是一個高階的的編譯器指令,它允許開發者指定更更多的編譯檢查和一些高階的編譯期優化。
分為三種:
- 函式屬性 (Function Attribute)
- 型別屬性 (Variable Attribute )
- 變數屬性 (Type Attribute )
語法結構
__attribute__
語法格式為:__attribute__ ((attribute-list))
放在宣告分號“;”前面。
比如,在三方庫中最常見的,宣告一個屬性或者方法在當前版本棄用了
@property (strong,nonatomic)CLASSNAME * property __deprecated;
這樣的好處是:給開發者一個過渡的版本,讓開發者知道這個屬性被棄用了,應當使用最新的API,但是被__deprecated的屬性仍然可以正常使用。如果直接棄用,會導致開發者在更新Pod的時候,程式碼無法執行了。
__attribtue__
的使用場景很多,本文只列舉iOS開發中常用的幾個:
//棄用API,用作API更新 #define __deprecated __attribute__((deprecated)) //帶描述資訊的棄用 #define __deprecated_msg(_msg) __attribute__((deprecated(_msg))) //遇到__unavailable的變數/方法,編譯器直接丟擲Error #define __unavailable __attribute__((unavailable)) //告訴編譯器,即使這個變數/方法 沒被使用,也不要丟擲警告 #define __unused __attribute__((unused)) //和__unused相反 #define __used __attribute__((used)) //如果不使用方法的返回值,進行警告 #define __result_use_check __attribute__((__warn_unused_result__)) //OC方法在Swift中不可用 #define __swift_unavailable(_msg) __attribute__((__availability__(swift, unavailable, message=_msg)))
Clang警告處理
你一定還見過如下程式碼:
#pragma clang diagnostic push #pragma clang diagnostic ignored "-Wundeclared-selector" ///程式碼 #pragma clang diagnostic pop
這段程式碼的作用是
- 對當前編譯環境進行壓棧
- 忽略
-Wundeclared-selector
(未宣告的)Selector警告 - 編譯程式碼
- 對編譯環境進行出棧
通過clang diagnostic push/pop,你可以靈活的控制程式碼塊的編譯選項。
我在之前的一篇文章裡,詳細的介紹了XCode的警告相關內容。本文篇幅限制,就不詳細講解了。
預處理
所謂預處理,就是在編譯之前的處理。預處理能夠讓你定義編譯器變數,實現條件編譯。
比如,這樣的程式碼很常見
#ifdef DEBUG //... #else //... #endif
同樣,我們同樣也可以定義其他預處理變數,在XCode-選中Target-build settings中,搜尋proprecess。然後點選圖中藍色的加號,可以分別為debug和release兩種模式設定預處理巨集。
比如我們加上:TestServer
,表示在這個巨集中的程式碼執行在測試伺服器
然後,配合多個Target(右鍵Target,選擇Duplicate),單獨一個Target負責測試伺服器。這樣我們就不用每次切換測試伺服器都要修改程式碼了。
#ifdef TESTMODE //測試伺服器相關的程式碼 #else //生產伺服器相關程式碼 #endif
插入指令碼
通常,如果你使用CocoaPod來管理三方庫,那麼你的Build Phase是這樣子的:
其中:[CP]開頭的,就是CocoaPod插入的指令碼。
- Check Pods Manifest.lock,用來檢查cocoapod管理的三方庫是否需要更新
- Embed Pods Framework,執行指令碼來連結三方庫的靜態/動態庫
- Copy Pods Resources,執行指令碼來拷貝三方庫的資原始檔
而這些配置資訊都儲存在這個檔案(.xcodeprog)裡
到這裡,CocoaPod的原理也就大致搞清楚了,通過修改xcodeproject,然後配置編譯期指令碼,來保證三方庫能夠正確的編譯連線。
同樣,我們也可以插入自己的指令碼,來做一些額外的事情。比如,每次進行archive的時候,我們都必須手動調整target的build版本,如果一不小心,就會忘記。這個過程,我們可以通過插入指令碼自動化。
buildNumber=$(/usr/libexec/PlistBuddy -c "Print CFBundleVersion" "${PROJECT_DIR}/${INFOPLIST_FILE}") buildNumber=$(($buildNumber + 1)) /usr/libexec/PlistBuddy -c "Set :CFBundleVersion $buildNumber" "${PROJECT_DIR}/${INFOPLIST_FILE}"
這段指令碼其實很簡單,讀取當前pist的build版本號,然後對其加一,重新寫入。
使用起來也很簡單:
Xcode – 選中Target – 選中build phase
選擇新增Run Script Phase
然後把這段指令碼拷貝進去,並且勾選Run Script Only When installing,保證只有我們在安裝到裝置上的時候,才會執行這段指令碼。重新命名指令碼的名字為Auto Increase build number
然後,拖動這個指令碼的到Link Binary With Libraries下面
指令碼編譯打包
指令碼化編譯打包對於CI(持續整合)來說,十分有用。iOS開發中,編譯打包必備的兩個命令是:
//編譯成.app xcodebuild -workspace $projectName.xcworkspace -scheme $projectName -configuration $buildConfig clean build SYMROOT=$buildAppToDir //打包 xcrun -sdk iphoneos PackageApplication -v $appDir/$projectName.app -o $appDir/$ipaName.ipa 通過info命令,可以檢視到詳細的文件 info xcodebuild
在本文最後的附錄中,提供了我之前使用的一個自動打包的指令碼。
提高專案編譯速度
通常,當專案很大,原始碼和三方庫引入很多的時候,我們會發現編譯的速度很慢。在瞭解了XCode的編譯過程後,我們可以從以下角度來優化編譯速度:
檢視編譯時間
我們需要一個途徑,能夠看到編譯的時間,這樣才能有個對比,知道我們的優化究竟有沒有效果。
對於XCode 8,關閉XCode,終端輸入以下指令
$ defaults write com.apple.dt.Xcode ShowBuildOperationDuration YES
然後,重啟XCode,然後編譯,你會在這裡看到編譯時間。
程式碼層面的優化
forward declaration
所謂forward declaration
,就是@class CLASSNAME
,而不是#import CLASSNAME.h
。這樣,編譯器能大大提高#import的替換速度。
對常用的工具類進行打包(Framework/.a)
打包成Framework或者靜態庫,這樣編譯的時候這部分程式碼就不需要重新編譯了。
常用標頭檔案放到預編譯檔案裡
XCode的pch檔案是預編譯檔案,這裡的內容在執行XCode build之前就已經被預編譯,並且引入到每一個.m檔案裡了。
編譯器選項優化
Debug模式下,不生成dsym檔案
上文提到了,dysm檔案裡儲存了除錯資訊,在Debug模式下,我們可以藉助XCode和LLDB進行除錯。所以,不需要生成額外的dsym檔案來降低編譯速度。
Debug開啟Build Active Architecture Only
在XCode -> Build Settings -> Build Active Architecture Only 改為YES。這樣做,可以只編譯當前的版本,比如arm7/arm64等等,記得只開啟Debug模式。這個選項在高版本的XCode中自動開啟了。
Debug模式下,關閉編譯器優化
編譯器優化
後續
本來這篇文章還有很多內容想寫,篇幅限制,就先這樣吧。最近發生了很多不開心的事,這裡提醒自己一句:吃一塹,長一智。
後面有時間了,會介紹一些編譯期黑科技:
- 寫入額外的編譯資訊
- 函式的呼叫過程和執行時找到函式在二進位制檔案中的的地址
- ……
附錄
自動編譯打包指令碼
export LC_ALL=zh_CN.GB2312; export LANG=zh_CN.GB2312 buildConfig="Release" //這裡是build模式 projectName=`find . -name *.xcodeproj | awk -F "[/.]" '{print $(NF-1)}'` projectDir=`pwd` wwwIPADir=~/Desktop/$projectName-IPA isWorkSpace=true echo "~~~~~~~~~~~~~~~~~~~開始編譯~~~~~~~~~~~~~~~~~~~" if [ -d "$wwwIPADir" ]; then echo $wwwIPADir echo "檔案目錄存在" else echo "檔案目錄不存在" mkdir -pv $wwwIPADir echo "建立${wwwIPADir}目錄成功" fi cd $projectDir rm -rf ./build buildAppToDir=$projectDir/build infoPlist="$projectName/Info.plist" bundleVersion=`/usr/libexec/PlistBuddy -c "Print CFBundleShortVersionString" $infoPlist` bundleIdentifier=`/usr/libexec/PlistBuddy -c "Print CFBundleIdentifier" $infoPlist` bundleBuildVersion=`/usr/libexec/PlistBuddy -c "Print CFBundleVersion" $infoPlist` if $isWorkSpace ; then #是否用CocoaPod echo "開始編譯workspace...." xcodebuild -workspace $projectName.xcworkspace -scheme $projectName -configuration $buildConfig clean build SYMROOT=$buildAppToDir else echo "開始編譯target...." xcodebuild -target $projectName -configuration $buildConfig clean build SYMROOT=$buildAppToDir fi if test $? -eq 0 then echo "~~~~~~~~~~~~~~~~~~~編譯成功~~~~~~~~~~~~~~~~~~~" else echo "~~~~~~~~~~~~~~~~~~~編譯失敗~~~~~~~~~~~~~~~~~~~" exit 1 fi ipaName=`echo $projectName | tr "[:upper:]" "[:lower:]"` #將專案名轉小寫 findFolderName=`find . -name "$buildConfig-*" -type d |xargs basename` #查詢目錄 appDir=$buildAppToDir/$findFolderName/ #app所在路徑 echo "開始打包$projectName.app成$projectName.ipa....." xcrun -sdk iphoneos PackageApplication -v $appDir/$projectName.app -o $appDir/$ipaName.ipa if [ -f "$appDir/$ipaName.ipa" ] then echo "打包$ipaName.ipa成功." else echo "打包$ipaName.ipa失敗." exit 1 fi path=$wwwIPADir/$projectName$(date +%Y%m%d%H%M%S).ipa cp -f -p $appDir/$ipaName.ipa $path #拷貝ipa檔案 echo "複製$ipaName.ipa到${wwwIPADir}成功" echo "~~~~~~~~~~~~~~~~~~~結束編譯,處理成功~~~~~~~~~~~~~~~~~~~"
相關文章
- 編譯器的工作過程和原理編譯
- ios底層 編譯過程iOS編譯
- 編譯器的編譯基本過程編譯
- vue原理:diff、模板編譯、渲染過程等Vue編譯
- 編譯過程編譯
- GCC編譯和連結過程GC編譯
- Javac編譯過程Java編譯
- 編譯核心過程編譯
- 交叉編譯Qt/E和Qtopia過程編譯QT
- 編譯原理入門篇|一篇文章理解編譯全過程編譯原理
- 編譯器的工作過程編譯
- EVC編譯TCPMP的過程編譯TCP
- iOS學習之深入理解程式編譯過程iOS編譯
- CMM編譯器和C編譯器過程呼叫實現的比較編譯
- 編譯連結過程編譯
- 編譯過程簡介編譯
- C++ 編譯過程C++編譯
- 淺談 iOS 應用啟動過程iOS
- JavaScript的預編譯過程分析JavaScript編譯
- 編譯C++ 程式的過程編譯C++
- 筆記-iOS應用程式的啟動過程筆記iOS
- TIR 的概念和編譯原理編譯原理
- 編譯領域裡程碑之作:龍書《編譯原理》編譯原理
- 影像識別的原理、過程、應用前景,精華篇!
- Java程式碼編譯和執行的整個過程Java編譯
- .NET 程式碼編譯過程編譯
- glade 編譯過程 (轉)編譯
- vlc-android 的編譯過程Android編譯
- 淺談 iOS 事件的傳遞和響應過程iOS事件
- GCC編譯過程(預處理->編譯->彙編->連結)GC編譯
- C語言編譯和連結過程簡介C語言編譯
- log4cxx 的編譯安裝過程和使用編譯
- go語言編譯過程概述Go編譯
- 預編譯過程(AO+GO)編譯Go
- C程式編譯過程淺析C程式編譯
- Android 專案編譯過程Android編譯
- Android Makefile 編譯過程分析Android編譯
- Hive SQL 編譯過程詳解HiveSQL編譯