java集合遍歷的幾種方式總結及比較

木叔發表於2016-11-04
集合類的通用遍歷方式, 用迭代器迭代:
Iterator it = list.iterator();
while(it.hasNext()) {
  Object obj = it.next();
}
 
Map遍歷方式:
 
1、通過獲取所有的key按照key來遍歷
//Set<Integer> set = map.keySet(); //得到所有key的集合
for (Integer in : map.keySet()) {
    String str = map.get(in);//得到每個key多對用value的值
}
 
2、通過Map.entrySet使用iterator遍歷key和value
Iterator<Map.Entry<Integer, String>> it = map.entrySet().iterator();
while (it.hasNext()) {
     Map.Entry<Integer, String> entry = it.next();
       System.out.println("key= " + entry.getKey() + " and value= " + entry.getValue());
}
 
3、通過Map.entrySet遍歷key和value,推薦,尤其是容量大時
for (Map.Entry<Integer, String> entry : map.entrySet()) {
    //Map.entry<Integer,String> 對映項(鍵-值對)  有幾個方法:用上面的名字entry
    //entry.getKey() ;entry.getValue(); entry.setValue();
    //map.entrySet()  返回此對映中包含的對映關係的 Set檢視。
    System.out.println("key= " + entry.getKey() + " and value= " + entry.getValue());
}
 
4、通過Map.values()遍歷所有的value,但不能遍歷key
for (String v : map.values()) {
    System.out.println("value= " + v);
}
 
List遍歷方式:
第一種:
for(Iterator iterator = list.iterator();iterator.hasNext();){                    
    int i = (Integer) iterator.next();                   
    System.out.println(i);               
}
第二種:
Iterator iterator = list.iterator();
while(iterator.hasNext()){
    int i = (Integer) iterator.next();
    System.out.println(i);
}
第三種:
for (Object object : list) { 
    System.out.println(object); 
}
第四種:
for(int i = 0 ;i<list.size();i++) {  
    int j= (Integer) list.get(i);
    System.out.println(j);  
}
 
資料元素是怎樣在記憶體中存放的?
 主要有2種儲存方式:
1、順序儲存,Random Access(Direct Access):
        這種方式,相鄰的資料元素存放於相鄰的記憶體地址中,整塊記憶體地址是連續的。可以根據元素的位置直接計算出記憶體地址,直接進行讀取。讀取一個特定位置元素的平均時間複雜度為O(1)。正常來說,只有基於陣列實現的集合,才有這種特性。Java中以ArrayList為代表。
2、鏈式儲存,Sequential Access:
        這種方式,每一個資料元素,在記憶體中都不要求處於相鄰的位置,每個資料元素包含它下一個元素的記憶體地址。不可以根據元素的位置直接計算出記憶體地址,只能按順序讀取元素。讀取一個特定位置元素的平均時間複雜度為O(n)。主要以連結串列為代表。Java中以LinkedList為代表。
 
每個遍歷方法的實現原理是什麼?
 1、傳統的for迴圈遍歷,基於計數器的:
        遍歷者自己在集合外部維護一個計數器,然後依次讀取每一個位置的元素,當讀取到最後一個元素後,停止。主要就是需要按元素的位置來讀取元素。
2、迭代器遍歷,Iterator:
        每一個具體實現的資料集合,一般都需要提供相應的Iterator。相比於傳統for迴圈,Iterator取締了顯式的遍歷計數器。所以基於順序儲存集合的Iterator可以直接按位置訪問資料。而基於鏈式儲存集合的Iterator,正常的實現,都是需要儲存當前遍歷的位置。然後根據當前位置來向前或者向後移動指標。
3、foreach迴圈遍歷:
        根據反編譯的位元組碼可以發現,foreach內部也是採用了Iterator的方式實現,只不過Java編譯器幫我們生成了這些程式碼。
 
各遍歷方式對於不同的儲存方式,效能如何?
1、傳統的for迴圈遍歷,基於計數器的:
        因為是基於元素的位置,按位置讀取。所以我們可以知道,對於順序儲存,因為讀取特定位置元素的平均時間複雜度是O(1),所以遍歷整個集合的平均時間複雜度為O(n)。而對於鏈式儲存,因為讀取特定位置元素的平均時間複雜度是O(n),所以遍歷整個集合的平均時間複雜度為O(n2)(n的平方)。
ArrayList按位置讀取的程式碼:直接按元素位置讀取。
transient Object[] elementData;

public E get(int index) {
    rangeCheck(index);
    return elementData(index);
}

E elementData(int index) {
    return (E) elementData[index];
}

 

LinkedList按位置讀取的程式碼:每次都需要從第0個元素開始向後讀取。其實它內部也做了小小的優化。

transient int size = 0;
transient Node<E> first;
transient Node<E> last;

public E get(int index) {
    checkElementIndex(index);
    return node(index).item;
}

Node<E> node(int index) {
    if (index < (size >> 1)) {   //查詢位置在連結串列前半部分,從連結串列頭開始查詢
        Node<E> x = first;
        for (int i = 0; i < index; i++)
            x = x.next;
        return x;
    } else {                     //查詢位置在連結串列後半部分,從連結串列尾開始查詢
        Node<E> x = last;
        for (int i = size - 1; i > index; i--)
            x = x.prev;
        return x;
    }
}

 

 2、迭代器遍歷,Iterator:
        那麼對於RandomAccess型別的集合來說,沒有太多意義,反而因為一些額外的操作,還會增加額外的執行時間。但是對於Sequential Access的集合來說,就有很重大的意義了,因為Iterator內部維護了當前遍歷的位置,所以每次遍歷,讀取下一個位置並不需要從集合的第一個元素開始查詢,只要把指標向後移一位就行了,這樣一來,遍歷整個集合的時間複雜度就降低為O(n);
(這裡只用LinkedList做例子)LinkedList的迭代器,內部實現,就是維護當前遍歷的位置,然後操作指標移動就可以了:
程式碼:
public E next() {
    checkForComodification();
    if (!hasNext())
        throw new NoSuchElementException();

    lastReturned = next;
    next = next.next;
    nextIndex++;
    return lastReturned.item;
}

public E previous() {
    checkForComodification();
    if (!hasPrevious())
        throw new NoSuchElementException();

    lastReturned = next = (next == null) ? last : next.prev;
    nextIndex--;
    return lastReturned.item;
}
 
3、foreach迴圈遍歷:
        分析Java位元組碼可知,foreach內部實現原理,也是通過Iterator實現的,只不過這個Iterator是Java編譯器幫我們生成的,所以我們不需要再手動去編寫。但是因為每次都要做型別轉換檢查,所以花費的時間比Iterator略長。時間複雜度和Iterator一樣。
Iterator和foreach位元組碼如下:
//使用Iterator的位元組碼:
    Code:
       0: new           #16                 // class java/util/ArrayList
       3: dup
       4: invokespecial #18                 // Method java/util/ArrayList."<init>":()V
       7: astore_1
       8: aload_1
       9: invokeinterface #19,  1           // InterfaceMethod java/util/List.iterator:()Ljava/util/Iterator;
      14: astore_2
      15: goto          25
      18: aload_2
      19: invokeinterface #25,  1           // InterfaceMethod java/util/Iterator.next:()Ljava/lang/Object;
      24: pop
      25: aload_2
      26: invokeinterface #31,  1           // InterfaceMethod java/util/Iterator.hasNext:()Z
      31: ifne          18
      34: return
 
 
//使用foreach的位元組碼:
    Code:
       0: new           #16                 // class java/util/ArrayList
       3: dup
       4: invokespecial #18                 // Method java/util/ArrayList."<init>":()V
       7: astore_1
       8: aload_1
       9: invokeinterface #19,  1           // InterfaceMethod java/util/List.iterator:()Ljava/util/Iterator;
      14: astore_3
      15: goto          28
      18: aload_3
      19: invokeinterface #25,  1           // InterfaceMethod java/util/Iterator.next:()Ljava/lang/Object;
      24: checkcast     #31                 // class loop/Model
      27: astore_2
      28: aload_3
      29: invokeinterface #33,  1           // InterfaceMethod java/util/Iterator.hasNext:()Z
      34: ifne          18
      37: return
View Code

 

各遍歷方式的適用於什麼場合?
1、傳統的for迴圈遍歷,基於計數器的:
        順序儲存:讀取效能比較高。適用於遍歷順序儲存集合。
        鏈式儲存:時間複雜度太大,不適用於遍歷鏈式儲存的集合。
2、迭代器遍歷,Iterator:
        順序儲存:如果不是太在意時間,推薦選擇此方式,畢竟程式碼更加簡潔,也防止了Off-By-One的問題。
        鏈式儲存:意義就重大了,平均時間複雜度降為O(n),還是挺誘人的,所以推薦此種遍歷方式。
3、foreach迴圈遍歷:
        foreach只是讓程式碼更加簡潔了,但是他有一些缺點,就是遍歷過程中不能運算元據集合(刪除等),所以有些場合不使用。而且它本身就是基於Iterator實現的,但是由於型別轉換的問題,所以會比直接使用Iterator慢一點,但是還好,時間複雜度都是一樣的。所以怎麼選擇,參考上面兩種方式,做一個折中的選擇。
 
Java的最佳實踐是什麼?
Java資料集合框架中,提供了一個RandomAccess介面,該介面沒有方法,只是一個標記。通常被List介面的實現使用,用來標記該List的實現是否支援Random Access。
一個資料集合實現了該介面,就意味著它支援Random Access,按位置讀取元素的平均時間複雜度為O(1)。比如ArrayList。
而沒有實現該介面的,就表示不支援Random Access。比如LinkedList。
所以看來JDK開發者也是注意到這個問題的,那麼推薦的做法就是,如果想要遍歷一個List,那麼先判斷是否支援Random Access,也就是 list instanceof RandomAccess。
比如:
if (list instanceof RandomAccess) {
    //使用傳統的for迴圈遍歷。
} else {
    //使用Iterator或者foreach。
}

 

 
 
 

相關文章