NSArray,NSDictionary,NSSet 當中的演算法知識

MrPeak發表於2016-11-02

iOS程式設計當中的幾個集合類：NSArray，NSDictionary，NSSet以及對應的Mutable版本，應該所有人都用過。只是簡單使用的話，相信沒人會用錯，但要做到高效（時間複雜度）精確（業務準確性），還需要了解其中所隱藏的演算法知識。

在專案當中使用集合類幾乎是不可避免的，集合類的使用場景其實可以進行抽象的歸類。大多數時候我們需要將若干個物件（object）暫時儲存起來，以備後續的業務邏輯進行操作，「儲存和操作」，或者說「存與取」，對應到計算機世界的術語就是讀和寫。最初儲存的時候我們Insert，下次進行更新的時候我們再Get，不再需要的時候我們呼叫Delete，所以你看集合類的操作場景其實就那麼多，關鍵在於我們存的方式，和取的方式不同。

最初我們學習資料結構和演算法的時候，知道資料的組織方式不同，比如Array, List, Stack, Heap, Tree，其對應的讀和取效率（時間複雜度）也不同。如果insert的效率高，下次get的時候效率就低，比如無序的Array，插入的時候O（1），查詢的時候就變O（N）。如果想要查詢的速度快，比如排序過的Array，查詢的速度在O（logN），插入的時候就必須要保持Array有序這一特性O（N）。所以插入和查詢是魚與熊掌，想要下次快速的找到一本書，就必須在整理書架的時候多花些心思分門別類。或者我們跳出時間的維度，用更多的空間來做彌補，使用雜湊表或者Dictionary來儲存資料，查詢的速度可以快至O（1），缺點是犧牲了更多的空間。

當我們預先存好Array之後，使用的時候大多是以下幾種場景：

場景一

for (NSObject* obj in self.arr) {
    //update each object
}

for (NSObject* obj in self.arr) {

//update each object

}

場景二

if ([self.arr containsObject:obj] == false) {
    [self.arr addObject:obj];
}

if ([self.arr containsObject:obj] == false) {

[self.arr addObject:obj];

}

場景三

if ([self.arr containsObject:obj] == true) {
    [self.arr removeObject:obj];
}

if ([self.arr containsObject:obj] == true) {

[self.arr removeObject:obj];

}

第一種場景沒有多少可發掘的，一次乾淨利索的遍歷費時O（N）。唯一需要注意的是切忌在遍歷的時候改變集合物件，比如：

for (NSObject* obj in self.arr) {
    if(obj.isInvalid){
        [self.arr removeObject:obj];
    }
}

for (NSObject* obj in self.arr) {

if(obj.isInvalid){

[self.arr removeObject:obj];

}

如果要在遍歷的時候刪除可以換種寫法，比如：

for (int i = self.arr.count-1; i > 0; i --) {
    NSObject* obj = self.arr[i];
    if (obj.isInvalid) {
        [self.arr removeObject:obj];
    }
}

for (int i = self.arr.count-1; i > 0; i --) {

NSObject* obj = self.arr[i];

if (obj.isInvalid) {

[self.arr removeObject:obj];

}

場景二和場景三需要特別留意，containsObject，removeObject都涉及到一個集合當中的重要概念，即相等性。

值的相等性很簡單，不用思索就能得出直觀的答案，比如1==1，2.0f==2.0f。

物件的相等性就不那麼簡單了。什麼時候我們認為兩個物件是相等的呢？我們可以從兩個維度去理解相等性。

同一物件相等：

理論上說兩個物件的指標如果是指向同一塊記憶體區域，那麼他們一定是相等的，一定是指向同一個物件。這種情況下我們判斷相等性是通過

if (obj1 == obj2)

1	if (obj1 == obj2)

業務屬性相等：

兩個物件即使不指向同一塊記憶體區域，但他們的所有（或者部分關鍵的）property是相等的，我們也可以認為這兩個物件是相等的，比如連個UserProfile物件，他們的name，gener，age屬性都相等，在業務層面，我們可以認為他們是相等的，此時我們不能用==來判斷相等性了，需要過載isEqual，或者自己實現isEqualToXXX：

@implementation MyObject

- (BOOL)isEqual:(id)object
{
    if (self == object) {
        return true;
    }
    if ([object isKindOfClass:[self class]] == false) {
        return false;
    }

    MyObject* myObject = object;
    if ([self.name isEqualToString:myObject.name]) {
        return true;
    }

    return false;
}

@end

@implementation MyObject

- (BOOL)isEqual:(id)object

{

if (self == object) {

return true;

}

if ([object isKindOfClass:[self class]] == false) {

return false;

}

MyObject* myObject = object;

if ([self.name isEqualToString:myObject.name]) {

return true;

}

return false;

}

@end

所以當我們判斷兩個集合當中物件是否相等時，一定要心中明確是那種相等。當呼叫containsObject，removeObject的時候，如果我們過載了isEqual，系統就通過我們的isEqual方法來判斷相等性，如果沒有過載，那麼系統就會通過判斷記憶體地址來判斷相等性了。

有些架構model layer的設計會允許同一個業務物件在應用層存在多份拷貝，此時在Array當中使用相等性的時候尤其要注意過載isEqua方法。當然有些mode layer只允許一份拷貝，一個業務物件永遠只對應一個記憶體地址，isEqual方法就變得多餘了。

和isEqual配套的另一個方法hash也經常被提起，官方文件甚至規定isEqual和hash必須被同時實現。學習過hash表之後，我們知道如果兩個物件業務上相等，那麼他們的hash值一定是相等的，hash方法的用處還是在於判斷相等性，系統預設的hash方法實際上返回的就是物件的記憶體地址。問題是我們已經有isEqual方法來判斷相等性了，為什麼還需要一個hash呢？

答案是hash可以更加高效快速的判斷一個物件是否存在集合當中，在NSArray當中我們需要遍歷Array，呼叫N次isEqual才能知道物件是否存在集合當中，時間複雜度是O（N）。在呼叫isEqual之前，可以通過呼叫hash來判斷是否相等，如果hash值不等就沒有進一步呼叫isEqual的必要了，如果相等必須再呼叫一次isEqual來確認是否真正相等。但是hash為什麼會比isEqual的效率要高呢？看下hash的宣告就明白了。

- (NSUInteger)hash
{
    return [_name hash];
}

- (NSUInteger)hash

{

return [_name hash];

}

hash方法的返回值是一個NSUInteger，這個值往往和物件在記憶體當中的儲存位置直接相關，也就是說我們可以通過這個值以O（1）的複雜度快速讀取到某個物件來判斷相等性，和Array O（N）的複雜度相比快了太多了，Array顯然不具備這種特性，Array當中的元素是在一片記憶體空間當中連續排放的，和hash的返回值沒任何關係。

但這種使用hash的便捷性有一個前提：物件在集合當中是唯一的，也就是說集合當中不允許存在重複的元素，比如NSDictionary，NSSet。我們在使用下列方法的時候：

[dictionary objectForKey:key];

1	[dictionary objectForKey:key];

[set addObject:object];

1	[set addObject:object];

為了保證唯一性，都需要先判斷物件是否存在集合當中，此時一個高效的判斷機制十分重要，這也就是hash發揮作用的地方，這也是為什麼使用NSArray的時候只會呼叫isEqual，而使用NSDictionary，NSSet的時候會頻繁呼叫hash的原因。

所以當我們使用NSDictionary，NSSet的時候，同時過載isEqual和hash方法對效能至關重要。hash方法的選擇並不需要過分挑剔，對關鍵的property做下運算，保證絕大部分場景下hash值不同即可，畢竟hash呼叫之後還是會呼叫isEqual做進一步判斷，並不會對我們業務的準確性產生影響。

Objective C當中的幾個關鍵集合類：NSArray，NSDictionary，NSSet要高效的使用並沒有看起來那麼簡單，當集合類中的元素到達一定量級之後，考慮下背後的演算法效率很有必要，這也是為什麼一直強調演算法對於程式設計師的重要性。

打賞支援我寫出更多好文章，謝謝！
打賞作者

打賞支援我寫出更多好文章，謝謝！

NSArray,NSDictionary,NSSet 當中的演算法知識

筆記-集合NSSet、字典NSDictionary的底層實現原理
2019-01-30
筆記
Mybatis中的小知識
2018-05-11
MyBatis
web開發知識體系中必要的知識點
2022-09-08
Web
OC-NSArray的基本介紹
2024-07-08
NSDictionary底層實現原理
2018-08-01
NSArray 簡單細說
2018-08-18
具體的知識 && 知識在專案中的應用（以指標和記憶體的知識引出）
2019-05-13
指標記憶體
演算法基礎知識總結
2022-02-19
演算法
ESLint規則中的JavaScript知識
2018-07-24
EsLintJavaScript
小知識|Java中的"魔數"
2021-12-14
Java
python中pandas的知識點整理
2021-09-11
Python
藍橋杯知識點彙總：基礎知識和常用演算法
2020-02-10
演算法
按照NSArray內部的某個物件排序
2018-05-22
物件排序
【知識】圖論朱劉演算法梳理
2024-12-01
圖論演算法
Python 中不易懂的小知識點
2024-04-10
Python
Flutter 小知識,Key的使用(獲取當前點選Widget位置/獲取當前Widget大小)
2020-12-04
Flutter
web前端工程師到底要不要學習演算法知識？學習演算法知識有什麼用？
2019-12-03
Web前端工程師演算法
【知識分享】主要影響伺服器使其當機的因素有哪些
2022-11-28
伺服器
攜程演算法筆試題知識點
2018-09-06
演算法筆試
刷演算法中途複習基礎知識
2024-07-22
演算法
Golang 中的 Defer 必掌握的 7 知識點
2020-03-23
Golang
Java中IO流的知識點總結
2020-10-04
Java
Vuejs基本知識(五)【檢視中的渲染】
2018-12-24
VueJS
知識點：Python中的列表合併操作
2024-11-04
Python
五十音小遊戲中的前端知識
2021-07-21
遊戲前端
模式識別中的Apriori演算法和FPGrowth演算法
2019-03-04
模式演算法
初識python必知的6個知識點
2022-04-29
Python
人工智慧（二、知識表示）——1.知識表示與知識表示的概念
2020-10-06
人工智慧
關於圖演算法 & 圖分析的基礎知識概覽
2019-05-16
演算法
記錄：演算法題數學知識總結
2018-10-20
演算法
知識圖譜入門——知識表示與知識建模
2018-12-10
vue實踐中的常見知識漏洞001
2019-03-04
Vue
Python中關於Thread的一點小知識
2019-02-26
Pythonthread
CSS世界中那些說起來很冷的知識
2018-07-09
CSS
直播中需要了解的AAC基礎知識
2018-05-21
influxdb知識總結（2）--- influxdb 中的重要概念
2019-11-18
UX
vue中關於測試的知識介紹
2020-10-09
Vue
【Python基礎知識】Python中的while語句
2020-04-28
PythonWhile
深度理解Nodejs中crypto模組的安全知識
2018-12-31
NodeJS

NSArray,NSDictionary,NSSet 當中的演算法知識

同一物件相等：

業務屬性相等：

打賞支援我寫出更多好文章，謝謝！

相關文章