Java 基礎 - 各項集合實現

蘆葦科技App技術團隊發表於2018-11-29

原文網址 : https://juejin.im/post/5bff9788518825490e0f91b7

[toc]

Java 類庫中的集合介面和迭代器

集合介面及迭代器

集合類的基本介面是：Collection

    public interface Collection<E>{
        // 集合改變返回 true，否則返回 false
        boolean add();
        boolean addAll();
        // 返回一個迭代器
        Iterator<E> iterator();
        int size();
        boolean isEmpty();
        // 集合中包含了和 obj 相等的物件，那麼返回 true
        boolean contains(Object obj);
        // 如果集合中包含 other 集合中的所有元素，那麼返回 true
        boolean containsAll(Collect<?> other);
        // 從這個集合中刪除等於 obj 的物件，如果有匹配的物件，返回 true
        boolean remove(Object obj);
        // 從這個集合中刪除 other 中存在的元素，如果這個呼叫改變了集合，那麼返回 true
        boolean removeAll(Collect<?> other);
        void clear();
        // 從這個集合中刪除所有與 other 這個集合中的元素不同的元素，如果這個呼叫改變了集合，那麼返回 true
        boolean retainAll(Collection<?> other);
        Object[] toArray();
        <T> T[] toArray(T[] a);
        
    }
複製程式碼

迭代器

    public interface Iterator<E>{
        // 反覆呼叫，可以逐個訪問集合中的每個元素(配合 hasNext()  這個方法)
        E next();
        boolean hasNext();
        // 刪除上次呼叫 next() 返回的元素,沒有呼叫 next() 方法，呼叫 remove() 則會報 IllegalStateException 異常
        void remove();
    }
複製程式碼

迭代器的用法

用法 1

    Collection<String> c = ....;
    Iterator<String> iterator = c.iterator();
    while(iterator.hasNext()){
        String element = iterator.next();
        iterator.remove();
        // todo something
    }
複製程式碼

用法 2：java SE 5.0 之後的寫法，for each 迴圈操作

    Collection<String> c = ....;
    for(String element : c){
        // todo something
    }
複製程式碼

“for each” 迴圈可以與任何實現了 Iterable 介面的物件一起工作

集合概覽圖

具體的集合實現

ArrayList

簡介

繼承於 AbstractList，實現了 List，是一個陣列佇列，提供新增、刪除、修改、遍歷的功能
實現了 RandomAccess 介面，提供隨機訪問的功能
實現了 Cloneable 介面，提供了克隆功能
實現了 java.io.Serializable 介面，提供序列化功能

定義

java.lang.Object
   ↳     java.util.AbstractCollection<E>
         ↳     java.util.AbstractList<E>
               ↳     java.util.ArrayList<E>

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable {}
複製程式碼

特性

關於 ArrayList 是執行緒不安全的，那麼 ArrayList 只能在單執行緒中使用，如果需要多執行緒使用的話，那麼可以使用 Vector。或者是以下方式

    // 將其包裝成執行緒安全
    List list = Collections.synchronizedList(new ArrayList());
複製程式碼

ArrayList 是一個動態陣列佇列，它能高效的隨機訪問元素和順序遍歷，但對於插入和刪除效率會比較低，因為需要涉及到陣列的移動。

擴容

ArrayList 是一個動態的陣列，那麼一開始陣列的大小是固定的（預設的話為 10），當向 ArrayList 中插入某個陣列時，size 的值剛好為容量的大小，那麼就會觸發擴容的操作。擴容的方式是重新建立一個新的陣列，拷貝原來的資料到新的陣列中，並將新的元素插入到新的陣列中，舊的陣列則會被垃圾回收。
預設容量：10

擴容規則

JDK 1.6 及之前

int newCapacity = (oldCapacity * 3)/2 + 1;
複製程式碼

JDK 1.7 及之後

int newCapacity = oldCapacity + (oldCapacity >> 1);
複製程式碼

JDK 1.8

private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    if (newCapacity - minCapacity < 0)
     newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
    newCapacity = hugeCapacity(minCapacity);
    // minCapacity is usually close to size, so this is a win:
    elementData = Arrays.copyOf(elementData, newCapacity);
}

private static int hugeCapacity(int minCapacity) {
 if (minCapacity < 0) // overflow
        throw new OutOfMemoryError();
    return (minCapacity > MAX_ARRAY_SIZE) ?
    Integer.MAX_VALUE :
    MAX_ARRAY_SIZE;
}
複製程式碼

toArray()

2 種實現

        Object[] toArray()
        <T> T[] toArray(T[] contents)
複製程式碼

關於 “java.lang.ClassCastException”異常 toArray() 會丟擲異常是因為 toArray() 返回的是 Object[] 陣列，將 Object[] 轉換為其它型別(如如，將Object[]轉換為的Integer[])則會丟擲“java.lang.ClassCastException”異常，因為Java不支援向下轉型。
關於轉換為陣列的方式

    // toArray(T[] contents)呼叫方式一
public static Integer[] vectorToArray1(ArrayList<Integer> v) {
    Integer[] newText = new Integer[v.size()];
    v.toArray(newText);
    return newText;
}
// toArray(T[] contents)呼叫方式二。最常用！
public static Integer[] vectorToArray2(ArrayList<Integer> v) {
    Integer[] newText = (Integer[])v.toArray(new Integer[0]);
    return newText;
}
// toArray(T[] contents)呼叫方式三
public static Integer[] vectorToArray3(ArrayList<Integer> v) {
    Integer[] newText = new Integer[v.size()];
    Integer[] newStrings = (Integer[])v.toArray(newText);
    return newStrings;
}
複製程式碼

注意點

多執行緒的話不使用 ArrayList，而是使用 Vector。

LinkedList

一種可以在任意位置進行高效插入及刪除的操作的有序序列

簡介

繼承了 AbstractSequentialList 的雙向連結串列，因此 LinkedList 是可以被當做堆疊、列表和雙端列表進行操作
實現 List 介面，進行佇列的操作
實現 Cloneable 介面，可以進行克隆操作
實現 Deque 介面，可以進行雙端佇列操作
實現 java.io.Serializable 介面，可以實現序列化
非同步的

定義

java.lang.Object
   ↳     java.util.AbstractCollection<E>
         ↳     java.util.AbstractList<E>
               ↳     java.util.AbstractSequentialList<E>
                     ↳     java.util.LinkedList<E>
                     
public class LinkedList<E>
        extends AbstractSequentialList<E>
        implements List<E>, Deque<E>, Cloneable, java.io.Serializable
複製程式碼

特性

順序訪問的效率高，但是隨機訪問的效率比較低
刪除及新增的操作效率高
不同步（執行緒不安全）

將LinkedList當作 LIFO(後進先出)的堆疊示例

    public static void useLinkedListAsLIFO() {
        System.out.println("\nuseLinkedListAsLIFO");
        // 新建一個LinkedList
        LinkedList stack = new LinkedList();

        // 將1,2,3,4新增到堆疊中
        stack.push("1");
        stack.push("2");
        stack.push("3");
        stack.push("4");
        // 列印“棧”
        System.out.println("stack:"+stack);

        // 刪除“棧頂元素”
        System.out.println("stack.pop():"+stack.pop());
        
        // 取出“棧頂元素”
        System.out.println("stack.peek():"+stack.peek());

        // 列印“棧”
        System.out.println("stack:"+stack);
    }
複製程式碼

將LinkedList當作 FIFO(先進先出)的佇列

 public static void useLinkedListAsFIFO() {
        System.out.println("\nuseLinkedListAsFIFO");
        // 新建一個LinkedList
        LinkedList queue = new LinkedList();

        // 將10,20,30,40新增到佇列。每次都是插入到末尾
        queue.add("10");
        queue.add("20");
        queue.add("30");
        queue.add("40");
        // 列印“佇列”
        System.out.println("queue:"+queue);

        // 刪除(佇列的第一個元素)
        System.out.println("queue.remove():"+queue.remove());
    
        // 讀取(佇列的第一個元素)
        System.out.println("queue.element():"+queue.element());

        // 列印“佇列”
        System.out.println("queue:"+queue);
    }
複製程式碼

HashMap（JDK 1.7 及之前）

簡介

HashMap 它是基於 hash 表的 Map 介面實現，以 key-value 的形式存在的，HashMap 總是以 key-value 的形式存在的，系統會通過計算 key 的 hash 值來定位 key-value 的儲存位置的，我們可以快速的通過 key 來存取 value;

定義

public class HashMap<K,V>
        extends AbstractMap<K,V>
        implements Map<K,V>, Cloneable, Serializable
複製程式碼

資料結構

關於 HashMap 的資料結構，底層的話還是陣列的，只不過陣列的每一項就是一個連結串列

建構函式的原始碼

    public HashMap(int initialCapacity, float loadFactor) {
            //初始容量不能<0
            if (initialCapacity < 0)
                throw new IllegalArgumentException("Illegal initial capacity: "
                        + initialCapacity);
            //初始容量不能 > 最大容量值，HashMap的最大容量值為2^30
            if (initialCapacity > MAXIMUM_CAPACITY)
                initialCapacity = MAXIMUM_CAPACITY;
            //負載因子不能 < 0
            if (loadFactor <= 0 || Float.isNaN(loadFactor))
                throw new IllegalArgumentException("Illegal load factor: "
                        + loadFactor);

            // 計算出大於 initialCapacity 的最小的 2 的 n 次方值。
            int capacity = 1;
            while (capacity < initialCapacity)
                capacity <<= 1;

            this.loadFactor = loadFactor;
            //設定HashMap的容量極限，當HashMap的容量達到該極限時就會進行擴容操作
            threshold = (int) (capacity * loadFactor);
            //初始化table陣列
            table = new Entry[capacity];
            init();
        }
複製程式碼

Entry 的原始碼

    static class Entry<K,V> implements Map.Entry<K,V> {
            final K key;
            V value;
            Entry<K,V> next;
            final int hash;

            /**
             * Creates new entry.
             */
            Entry(int h, K k, V v, Entry<K,V> n) {
                value = v;
                next = n;
                key = k;
                hash = h;
            }
            .......
        }
複製程式碼

Entry 是 HashMap 的內部類，其中包含了 key，value 和下一個 Entry，以及 hash 值，正因為有這下才構成了陣列的項為一個列表。

容量、載入因子、臨界值及雜湊衝突

容量：table 陣列的大小，一般預設為 16

static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
複製程式碼

載入因子：表示 table 陣列的飽和程度
- 載入因子越大,填滿的元素越多,空間利用率越高，但衝突的機會加大了。反之;
- 載入因子越小,填滿的元素越少,衝突的機會減小,但空間浪費多了。
臨界值：
- 為了避免造成雜湊衝突率，那麼當 HashMap 的陣列長度達到一個臨界值的時候就會觸發擴容，把所有的元素重新計算 hash 值，再放到擴容後的容器中，這是一個比較耗時的操作。
  - 臨界值由載入因子及當前的容量來決定，預設情況下 16*0.75=12 就會觸發擴容
```
DEFAULT_INITIAL_CAPACITY*DEFAULT_LOAD_FACTOR
複製程式碼
```

雜湊衝突

在關鍵字的 hash 地址上已經有了記錄，那麼這就是雜湊衝突
複製程式碼

解決衝突的方法
- 開放定址法
- 再雜湊法
- 建立一個公共溢位區
- 鏈地址法（拉鍊法）

儲存實現：put(key,value)

public V put(K key, V value) {
            //當key為null，呼叫putForNullKey方法，儲存null與table第一個位置中，這是HashMap允許為null的原因
            if (key == null)
                return putForNullKey(value);
            //計算key的hash值
            int hash = hash(key.hashCode());                   ------(1)
            //計算key hash 值在 table 陣列中的位置
            int i = indexFor(hash, table.length);             ------(2)
            //從i出開始迭代 e,找到 key 儲存的位置
            for (Entry<K, V> e = table[i]; e != null; e = e.next) {
                Object k;
                //判斷該條鏈上是否有hash值相同的(key相同)
                //若存在相同，則直接覆蓋value，返回舊value
                if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                    V oldValue = e.value;    //舊值 = 新值
                    e.value = value;
                    e.recordAccess(this);
                    return oldValue;     //返回舊值
                }
            }
            //修改次數增加1
            modCount++;
            //將 key、value 新增至i位置處
            addEntry(hash, key, value, i);
            return null;
        }
複製程式碼

（1）處程式碼實現：技術 hash 值

static int hash(int h) {
            h ^= (h >>> 20) ^ (h >>> 12);
            return h ^ (h >>> 7) ^ (h >>> 4);
        }
複製程式碼

（2）處程式碼實現：根據 hash 值計算出 key 在 table 陣列中所對應的位置

    static int indexFor(int h, int length) {
            return h & (length-1);
        }
複製程式碼

（3）將節點插入表頭

    void addEntry(int hash, K key, V value, int bucketIndex) {
            //獲取bucketIndex處的Entry
            Entry<K, V> e = table[bucketIndex];
            //將新建立的 Entry 放入 bucketIndex 索引處，並讓新的 Entry 指向原來的 Entry 
            table[bucketIndex] = new Entry<K, V>(hash, key, value, e);
            //若HashMap中元素的個數超過極限了，則容量擴大兩倍
            if (size++ >= threshold)
                resize(2 * table.length);
        }
複製程式碼

儲存步驟：

step 1：判斷 key 是否為 null，若為 null，那麼直接呼叫 putForNullKey 方法（table[0] 的陣列項），否則進入 step2；
step 2：計算 key 的 hash 值
step 3：計算 key 的 hash 值在 table 陣列中的位置 index
step 4：在 table[index] 項中迭代，找出 key 的儲存位置，如果存在則替換就的值，並將舊的值返回，如果不存在對應的 key 的儲存位置，則進入 step5;
step 5：將 key-value 放在 table[index] 的連結串列頭

擴容問題

隨著 HashMap 中的元素越來越多，發生 hash 衝突的概率越來越大，連結串列的長度越來越長，查詢的效率就越來越低；這樣我們就必須在 HashMap 的某個臨界值進行擴容處理。擴容的方式：重新建立一個新的 table 陣列，重新計算 key 的 hash 值，並放入新的 table 陣列中，這樣的操作是比較耗時的，如果我們能夠預知 HashMap 中的大小時，我們可以指定 HashMap 中的元素個數。

讀取實現：get(key) 通過 key 的 hash 值找到在 table 陣列中的索引處的 Entry，然後返回該 key 對應的 value 即可。

    public V get(Object key) {
            // 若為null，呼叫getForNullKey方法返回相對應的value
            if (key == null)
                return getForNullKey();
            // 根據該 key 的 hashCode 值計算它的 hash 碼  
            int hash = hash(key.hashCode());
            // 取出 table 陣列中指定索引處的值
            for (Entry<K, V> e = table[indexFor(hash, table.length)]; e != null; e = e.next) {
                Object k;
                //若搜尋的key與查詢的key相同，則返回相對應的value
                if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
                    return e.value;
            }
            return null;
        }
複製程式碼

HashMap 非同步

HashMap 是執行緒不安全的，我們可以通過 Collections 的靜態方法 SynchronizedMap 來獲取執行緒安全的 HashMap

    Map map = Collections.SynchronizedMap(new HashMap<>();
複製程式碼

LinkedHashMap

介紹

LinkedHashMap 是 HashMap 的子類，因此 LinkedHashMap 擁有 HashMap 中的所有特性，但是 HashMap 的迭代是沒有順序的。LinkedHashMap 通過維護一個雙連結串列來保證迭代的順序（插入順序或者訪問順序），但是同時也增加了時間和空間的開銷。

資料結構

HashMap(陣列+連結串列)+雙連結串列

雙連結串列

```
/**
 * HashMap.Node subclass for normal LinkedHashMap entries.
 */
static class LinkedHashMapEntry<K,V> extends HashMap.Node<K,V> {
    LinkedHashMapEntry<K,V> before, after;
    LinkedHashMapEntry(int hash, K key, V value, Node<K,V> next) {
        super(hash, key, value, next);
    }
}

```
複製程式碼

重要變數

head：雙連結串列頭部，儲存最早插入的元素。
tail：雙連結串列的尾部，儲存最近插入的元素。
accessOrder：訪問順序（true：訪問順序迭代；false：插入順序迭代）

重要函式

// Callbacks to allow LinkedHashMap post-actions
    // 訪問元素之後
    void afterNodeAccess(Node<K,V> p) { }
    // 插入節點之後
    void afterNodeInsertion(boolean evict) { }
    // 刪除節點之後
    void afterNodeRemoval(Node<K,V> p) { }
複製程式碼

HashMap 和 HashTable 的區別

HashTable 和 HashMap 都實現了 Map 介面，他們的主要區別在於執行緒安全、速度。

HashMap 可以接受 key 為 null，HashTable 不可以接受 key 為 null
HashMap 是執行緒不安全（非 synchronize），HashTable 是執行緒安全的（synchronize)。synchronize 代表著每一次在一個執行緒中修改 HashTable 中的資料時，都需要獲得同步鎖，其他的執行緒要修改 HashTable 中的資料時，需要等待同步鎖被釋放才能進行。
HashMap 的迭代器是 Iterator，HashTable 的迭代器是 enumerator。
在單執行緒的操作中，HashMap 的操作速度要比 HashTable 快，因為 HashTable 是 synchronize 的，所以會有同步鎖的獲取和釋放過程。

HashSet

介紹
HashSet 是基於 HashMap 實現的，底層是使用 HashMap 來儲存陣列的

參考資料

Java基礎-集合框架
2018-05-13
Java框架
Java基礎 —— 集合（二）
2024-12-09
Java
java基礎詳解-集合
2021-03-14
Java
Java程式設計基礎17——集合(List集合)
2019-01-19
Java程式設計
Map集合（Java基礎、skycto JEEditor）
2019-09-11
Java
【JAVA】【面試】【基礎篇】- 集合
2019-10-30
Java面試
java集合框架基礎總結
2020-11-18
Java框架
Java基礎之淺談集合
2022-04-07
Java
Android基礎之Java集合框架Collection
2019-03-04
AndroidJava框架
Java基礎集合簡單總結
2020-12-29
Java
【Java基礎知識】Java陣列與集合
2020-05-19
Java陣列
基礎篇：JAVA集合，面試專用
2021-10-30
Java面試
java基礎使用的集合大總結
2020-12-29
Java
基礎-JAVA集合型別主要區別
2020-12-07
Java型別
從基礎講全排列（Java實現）
2019-03-29
Java
使用java實現希表的基礎功能
2020-07-26
Java
用原型實現Class的各項語法
2023-11-09
原型
java各種集合的執行緒安全
2018-08-12
Java執行緒
Java集合原始碼分析之基礎（二）：雜湊表
2018-08-08
Java原始碼
Java基礎之去除List集合中的重複元素
2020-12-22
Java
前端基礎功能，原生js實現輪播圖例項教程
2021-01-21
前端JS
【Java基礎教程】用Java實現猜數字小遊戲
2022-04-25
Java遊戲
實現Java集合迭代的高效能
2018-07-14
Java
夯實Java基礎系列19：一文搞懂Java集合類框架，以及常見面試題
2019-10-08
Java框架面試題
多執行緒基礎-基礎實現
2020-12-12
執行緒
Java集合實戰
2024-05-20
Java
夯實Java基礎系列8：深入理解Java內部類及其實現原理
2019-09-28
Java
夯實Java基礎系列18：深入理解Java內部類及其實現原理
2019-10-08
Java
實現MVC基礎框架
2018-09-11
MVC框架
Java基礎05 實施介面
2019-11-13
Java
Redis基礎知識（學習筆記12--集合的底層實現原理）
2024-07-02
Redis筆記
單例模式的各種實現方式（Java）
2022-01-26
單例模式Java
JAVA基礎之5-函式式介面的實現
2024-09-12
Java函式
【死磕 Java 基礎】 — 自己動手實現一個 LRU
2021-08-20
Java
Python基礎知識之集合
2019-02-16
Python
Pyspark資料基礎操作集合
2020-10-27
Spark
corejava基礎知識(5)-集合
2019-03-13
Java
傳智黑馬java基礎學習——day20（集合Map）
2019-01-23
Java

Java 基礎 - 各項集合實現

Java 類庫中的集合介面和迭代器

集合介面及迭代器

集合概覽圖

具體的集合實現

ArrayList

簡介

定義

特性

擴容

toArray()

注意點

LinkedList

簡介

定義

特性

將LinkedList當作 LIFO(後進先出)的堆疊示例

將LinkedList當作 FIFO(先進先出)的佇列

HashMap（JDK 1.7 及之前）

簡介

定義

資料結構

容量、載入因子、臨界值及雜湊衝突

雜湊衝突

儲存實現：put(key,value)

儲存步驟：

擴容問題

HashMap 非同步

LinkedHashMap

介紹

資料結構

雙連結串列

重要變數

重要函式

HashMap 和 HashTable 的區別

HashSet

參考資料

相關文章