Java集合細節(一):請為集合指定初始容量

茶花盛開發表於2017-05-17

集合是我們在Java程式設計中使用非常廣泛的,它就像大海,海納百川,像萬能容器,盛裝萬物,而且這個大海,萬能容器還可以無限變大(如果條件允許)。當這個海、容器的量變得非常大的時候,它的初始容量就會顯得很重要了,因為挖海、擴容是需要消耗大量的人力物力財力的。同樣的道理,Collection的初始容量也顯得異常重要。所以:對於已知的情景,請為集合指定初始容量。

public static void main(String[] args) {
        StudentVO student = null;        long begin1 = System.currentTimeMillis();
        List<StudentVO> list1 = new ArrayList<>();        for(int i = 0 ; i < 1000000; i++){
            student = new StudentVO(i,"chenssy_"+i,i);
            list1.add(student);
        }        long end1 = System.currentTimeMillis();
        System.out.println("list1 time:" + (end1 - begin1));        
        long begin2 = System.currentTimeMillis();
        List<StudentVO> list2 = new ArrayList<>(1000000);        for(int i = 0 ; i < 1000000;
         i++){
            student = new StudentVO(i,"chenssy_"+i,i);
            list2.add(student);
        }        long end2 = System.currentTimeMillis();
        System.out.println("list2 time:" + (end2 - begin2));
    }

上面程式碼兩個list都是插入1000000條資料,只不過list1沒有沒有申請初始化容量,而list2初始化容量1000000。那執行結果如下:

list1 time:1638

list2 time:921

如果你想學習Java可以來這個群,首先是二二零,中間是一四二,最後是九零六,裡面有大量的學習資料可以下載。

從上面的執行結果我們可以看出list2的速度是list1的兩倍左右。在前面LZ就提過,ArrayList的擴容機制是比較消耗資源的。我們先看ArrayList的add方法:

public boolean add(E e) {  
        ensureCapacity(size + 1);   
        elementData[size++] = e;  
        return true;  
    }  
    
    public void ensureCapacity(int minCapacity) {  
        modCount++;         //修改計數器
        int oldCapacity = elementData.length;    
        //當前需要的長度超過了陣列長度,進行擴容處理
        if (minCapacity > oldCapacity) {  
            Object oldData[] = elementData;  
            //新的容量 = 舊容量 * 1.5 + 1
            int newCapacity = (oldCapacity * 3)/2 + 1;  
                if (newCapacity < minCapacity)  
                    newCapacity = minCapacity;  
          //陣列拷貝,生成新的陣列 
          elementData = Arrays.copyOf(elementData, newCapacity);  
        }  
    }

ArrayList每次新增一個元素,就會檢測ArrayList的當前容量是否已經到達臨界點,如果到達臨界點則會擴容1.5倍。然而ArrayList的擴容以及陣列的拷貝生成新的陣列是相當耗資源的。所以若我們事先已知集合的使用場景,知道集合的大概範圍,我們最好是指定初始化容量,這樣對資源的利用會更加好,尤其是大資料量的前提下,效率的提升和資源的利用會顯得更加具有優勢。


相關文章