MJiOS底層筆記--OC物件本質

kirito_song發表於2019-01-24

MJiOS底層筆記--OC物件本質

本文屬筆記性質,主要針對自己理解不太透徹的地方進行記錄。

推薦系統直接學習小碼哥iOS底層原理班---MJ老師的課確實不錯,強推一波。


OC物件本質

基於C與C++結構體實現


OC語言如何被編譯器編譯:

OC ==> C++ ==> 彙編 ==> 機器語言

而在C++中只有struct(結構體)才能容納不同型別的內容(比如不同屬性)。


將Objective-C程式碼轉換為C\C++程式碼

  1. clang -rewrite-objc OC原始檔 -o 輸出的CPP檔案

將原始檔轉寫成通用的cpp檔案

  1. xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc OC原始檔 -o 輸出的CPP檔案

通過Xcode將原始檔轉寫成arm64架構下的iphoneos檔案,檔案內容比第一種要少

  1. 如果需要連結其他框架,使用-framework引數。比如-framework UIKit

NSObject的OC與C++定義

  • 在OC中的定義
@interface NSObject <NSObject> {
    Class isa;
}
複製程式碼
  • 轉成C++之後的定義
struct NSObject_IMPL {
	Class isa;
};
複製程式碼

對於結構體來說,和陣列一樣。其第一個成員的地址,即為結構體物件的地址。 所以一個OC物件的地址,實際上就是其isa指標的地址。

而這個isa是指向objc_class結構體的指標

// 指標
typedef struct objc_class *Class;
複製程式碼

而一個指標在64位系統中所佔的記憶體為8位元組

所以一個OC物件所佔的記憶體至少為8位元組


NSObject物件所佔用記憶體的大小

上面的結論通過class_getInstanceSize函式也可以佐證:

#import <objc/runtime.h>

/*
獲得NSObject例項物件的
`成員變數`
所佔用的大小 >> 8
*/
NSLog(@"%zd", class_getInstanceSize([NSObject class]));


//runtime原始碼中
size_t class_getInstanceSize(Class cls)
{
    if (!cls) return 0;
    return cls->alignedInstanceSize();
}

// Class's ivar size rounded up to a pointer-size boundary.
uint32_t alignedInstanceSize() {
    return word_align(unalignedInstanceSize());
}
複製程式碼

需要注意這個word_align返回的是記憶體對齊後的大小,以unalignedInstanceSize(為對齊的)大小作為引數。

而對於NSObject *obj指標,我們有另一個函式可以檢視其實際被分配的記憶體大小

#import <malloc/malloc.h>
// 獲得obj指標所指向記憶體的大小 >> 16
NSLog(@"%zd", malloc_size((__bridge const void *)obj));
複製程式碼

為什麼8位元組的結構體會被分配16位元組

繼續看runtime

+ (id)alloc {
    return _objc_rootAlloc(self);
}

id _objc_rootAlloc(Class cls)
{
    return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}

static ALWAYS_INLINE id
callAlloc(Class cls, bool checkNil, bool allocWithZone=false)
{
    if (slowpath(checkNil && !cls)) return nil;

#if __OBJC2__
    if (fastpath(!cls->ISA()->hasCustomAWZ())) {
        // No alloc/allocWithZone implementation. Go straight to the allocator.
        // fixme store hasCustomAWZ in the non-meta class and 
        // add it to canAllocFast's summary
        if (fastpath(cls->canAllocFast())) {
            // No ctors, raw isa, etc. Go straight to the metal.
            bool dtor = cls->hasCxxDtor();
            id obj = (id)calloc(1, cls->bits.fastInstanceSize());
            if (slowpath(!obj)) return callBadAllocHandler(cls);
            obj->initInstanceIsa(cls, dtor);
            return obj;
        }
        else {
            // Has ctor or raw isa or something. Use the slower path.
            id obj = class_createInstance(cls, 0);
            if (slowpath(!obj)) return callBadAllocHandler(cls);
            return obj;
        }
    }
#endif

    // No shortcuts available.
    if (allocWithZone) return [cls allocWithZone:nil];
    return [cls alloc];
}


// Replaced by ObjectAlloc
+ (id)allocWithZone:(struct _NSZone *)zone {
    return _objc_rootAllocWithZone(self, (malloc_zone_t *)zone);
}


id _objc_rootAllocWithZone(Class cls, malloc_zone_t *zone)
{
    id obj;

#if __OBJC2__
    // allocWithZone under __OBJC2__ ignores the zone parameter
    (void)zone;
    obj = class_createInstance(cls, 0);
#else
    if (!zone) {
        obj = class_createInstance(cls, 0);
    }
    else {
        obj = class_createInstanceFromZone(cls, 0, zone);
    }
#endif

    if (slowpath(!obj)) obj = callBadAllocHandler(cls);
    return obj;
}

id class_createInstance(Class cls, size_t extraBytes)
{
    return _class_createInstanceFromZone(cls, extraBytes, nil);
}


static __attribute__((always_inline)) 
id
_class_createInstanceFromZone(Class cls, size_t extraBytes, void *zone, 
                              bool cxxConstruct = true, 
                              size_t *outAllocatedSize = nil)
{
    if (!cls) return nil;

    assert(cls->isRealized());

    // Read class's info bits all at once for performance
    bool hasCxxCtor = cls->hasCxxCtor();
    bool hasCxxDtor = cls->hasCxxDtor();
    bool fast = cls->canAllocNonpointer();

    size_t size = cls->instanceSize(extraBytes);
    if (outAllocatedSize) *outAllocatedSize = size;

    id obj;
    if (!zone  &&  fast) {
        obj = (id)calloc(1, size);
        if (!obj) return nil;
        obj->initInstanceIsa(cls, hasCxxDtor);
    } 
    else {
        if (zone) {
            obj = (id)malloc_zone_calloc ((malloc_zone_t *)zone, 1, size);
        } else {
            obj = (id)calloc(1, size);
        }
        if (!obj) return nil;

        // Use raw pointer isa on the assumption that they might be 
        // doing something weird with the zone or RR.
        obj->initIsa(cls);
    }

    if (cxxConstruct && hasCxxCtor) {
        obj = _objc_constructOrFree(obj, cls);
    }

    return obj;
}


size_t instanceSize(size_t extraBytes) {
    size_t size = alignedInstanceSize() + extraBytes;
    // CF requires all objects be at least 16 bytes.
    if (size < 16) size = 16;
    return size;
}
複製程式碼

alloc函式最終會根據instanceSize返回的size,然後使用calloc(1, size);函式去分配記憶體。

instanceSize函式中,alignedInstanceSize方法為成員變數所佔記憶體大小(上面已經貼過一次).extraBytes引數(據我所見)都為0。

CoreFoundation框架在instanceSize函式中硬性規定不足16位元組的記憶體地址會被補成16位位元組。

但實際上,NSObject物件只使用了8位元組用來儲存isa指標


Student物件的本質

@interface Student : NSObject
{
    @public
    int _no;
    int _age;
}
@end
複製程式碼

重寫成C++之後

struct Student_IMPL {
	struct NSObject_IMPL NSObject_IVARS;
	int _no;
	int _age;
};

struct NSObject_IMPL {
	Class isa;
};


//其實就是
struct Student_IMPL {
	Class isa; //8位元組
	int _no; //4位元組
	int _age; //4位元組
};
複製程式碼

所以一個OC物件的本質實際上是一個包含了所有父類成員變數+自身成員變數的結構體


Student的記憶體佈局及大小

可以通過Debug->Debug workflow->View momory檢視指定地址的結構來查證

MJiOS底層筆記--OC物件本質

對於Student例項物件所佔記憶體地址的大小,我們同樣可以通過malloc_size函式來確定。

結果是16。8位元組父類的isa指標、4位元組_age的int、4位元組_no的int。

MJiOS底層筆記--OC物件本質

當然如果有興趣可以用memory write (stu地址+8偏移量) 8的方式,通過直接修改記憶體的方式對成員變數_no的值進行修改。


記憶體對齊原則下的OC物件記憶體分配

alignedInstanceSize()函式的記憶體對齊

alignedInstanceSize()函式會按照所有成員變數中記憶體最長的一個做記憶體對齊。比如

@interface Animal: NSObject
{
    int weight;
    int height;
    int age;
}
複製程式碼

實際上只需要8+4+4+4=20個位元組長度即可,但是記憶體對其之後會返回8*3=24

malloc()/calloc()函式的記憶體對齊

在物件實際建立時,先以alignedInstanceSize()返回的大小作為參考。 然後calloc在實際分配記憶體時為了記憶體對齊,最終將會根據bucket進行分配。這個bucket是16的整數倍。

#define NANO_MAX_SIZE 256 /* Buckets sized {16, 32, 48, 64, 80, 96, 112, ...} */
複製程式碼

所以Animal的例項物件實際上會被分配32個位元組長度的記憶體地址。


sizeOf 與 class_getInstanceSize

返回一個引數物件所佔的記憶體大小

sizeOf

sizeOf是運算子,在程式編譯階段將會直接替換成引數型別所佔記憶體具體的常數值。

由於在編譯階段替換,所以有以下這種特性:

MJPerson *p = [[MJPerson alloc] init];
NSLog(@"%zd", sizeof(p)); // 8
複製程式碼

p在編譯時將會被認為成指標,返回8位元組的指標記憶體長度。而不是MJPerson型別的記憶體長度。

class_getInstanceSize

class_getInstanceSize是一個方法,在程式執行階段將會進行計算。

他可以在執行階段計算某個類所需記憶體大小

class_getInstanceSize([p class]) //24
複製程式碼

objc_class

runtime.h

OC2.0以前的類結構體。在2.0之後只剩下標頭檔案,並且已經標記成了OBJC2_UNAVAILABLE的棄用狀態。

struct objc_class {
    Class _Nonnull isa  OBJC_ISA_AVAILABILITY;

#if !__OBJC2__
    Class _Nullable super_class                              OBJC2_UNAVAILABLE;
    const char * _Nonnull name                               OBJC2_UNAVAILABLE;
    long version                                             OBJC2_UNAVAILABLE;
    long info                                                OBJC2_UNAVAILABLE;
    long instance_size                                       OBJC2_UNAVAILABLE;
    struct objc_ivar_list * _Nullable ivars                  OBJC2_UNAVAILABLE;
    struct objc_method_list * _Nullable * _Nullable methodLists                    OBJC2_UNAVAILABLE;
    struct objc_cache * _Nonnull cache                       OBJC2_UNAVAILABLE;
    struct objc_protocol_list * _Nullable protocols          OBJC2_UNAVAILABLE;
#endif

} OBJC2_UNAVAILABLE;
複製程式碼

objc_runtime_new.h

最新的runtime原始碼中,優化了類的結構,內部分工更加明確。

在一級結構體中,只保留了isasuperclasscache三個常用的成員

其餘資訊均轉移到了class_data_bits_t這個二級結構體上

struct objc_class : objc_object {
    // Class ISA;
    Class superclass;
    cache_t cache;             // 方法快取
    class_data_bits_t bits;    // 具體的類資訊

    class_rw_t *data() { 
        return bits.data();
    }
    void setData(class_rw_t *newData) {
        bits.setData(newData);
    }
    ...
}
複製程式碼

class_data_bits_t(類資訊列表)內部,還儲存著class_rw_t(可讀寫資訊列表),這些資訊是可以動態修改的

struct class_rw_t {
    // Be warned that Symbolication knows the layout of this structure.
    uint32_t flags;
    uint32_t version;

    const class_ro_t *ro;

    method_array_t methods; //方法
    property_array_t properties; //屬性
    protocol_array_t protocols; //協議

    Class firstSubclass;
    Class nextSiblingClass;

    char *demangledName;
}
複製程式碼

class_rw_t(可讀寫資訊列表)內部,還儲存著class_ro_t(不可變資訊列表),儲存著類載入進記憶體時就需要確定的資訊

struct class_ro_t {
    uint32_t flags;
    uint32_t instanceStart;
    uint32_t instanceSize; //例項物件所佔記憶體大小
#ifdef __LP64__
    uint32_t reserved;
#endif

    const uint8_t * ivarLayout;
    
    const char * name; //類名
    method_list_t * baseMethodList;
    protocol_list_t * baseProtocols;
    const ivar_list_t * ivars; //成員變數

    const uint8_t * weakIvarLayout;
    property_list_t *baseProperties;

    method_list_t *baseMethods() const {
        return baseMethodList;
    }
};
複製程式碼

參考資料

小碼哥iOS底層原理班

iOS複習筆記:OC物件記憶體大小問題

相關文章