BAT面試必備——Java 集合類

wwwxmu發表於2018-09-08

原文網址 : https://juejin.im/post/5b93f4def265da0a8d367159

本文首發於我的個人部落格：尾尾部落

來源：http://www.runoob.com/java/java-collections.html

來源：https://www.cnblogs.com/jing99/p/7057245.html

1. Iterator介面

Iterator介面，這是一個用於遍歷集合中元素的介面，主要包含hashNext(),next(),remove()三種方法。它的一個子介面LinkedIterator在它的基礎上又新增了三種方法，分別是add(),previous(),hasPrevious()。也就是說如果是先Iterator介面，那麼在遍歷集合中元素的時候，只能往後遍歷，被遍歷後的元素不會在遍歷到，通常無序集合實現的都是這個介面，比如HashSet，HashMap；而那些元素有序的集合，實現的一般都是LinkedIterator介面，實現這個介面的集合可以雙向遍歷，既可以通過next()訪問下一個元素，又可以通過previous()訪問前一個元素，比如ArrayList。

2. List

List是元素有序並且可以重複的集合。 List的主要實現：ArrayList, LinkedList, Vector。

2. ArrayList、LinkedList、Vector 的區別

	ArrayList	LinkedList	Vector
底層實現	陣列	雙向迴圈連結串列	陣列
同步性及效率	不同步，非執行緒安全，效率高	不同步，非執行緒安全，效率高	同步，執行緒安全，效率低
特點	查詢快,增刪慢	查詢慢,增刪快	查詢快,增刪慢
預設容量	10	/	10
擴容機制	int newCapacity = oldCapacity + (oldCapacity >> 1); //1.5 倍	/	2 倍

總結：

ArrayList 和 Vector 基於陣列實現，對於隨機訪問get和set，ArrayList優於LinkedList，因為LinkedList要移動指標。

LinkedList 不會出現擴容的問題，所以比較適合隨機位置增、刪。但是其基於連結串列實現，所以在定位時需要線性掃描，效率比較低。
當操作是在一列資料的後面新增資料而不是在前面或中間,並且需要隨機地訪問其中的元素時,使用ArrayList會提供比較好的效能；
當你的操作是在一列資料的前面或中間新增或刪除資料,並且按照順序訪問其中的元素時,就應該使用LinkedList了。

3. Set

Set集合中的物件不按特定的方式排序(存入和取出的順序不一定一致)，並且沒有重複物件。 Set的主要實現類：HashSet, TreeSet。

	HashSet	TreeSet	LinkedHashSet
底層實現	HashMap	紅黑樹	LinkedHashMap
重複性	不允許重複	不允許重複	不允許重複
有/無序	無序	有序，支援兩種排序方式，自然排序和定製排序，其中自然排序為預設的排序方式。	有序，以元素插入的順序來維護集合的連結表
時間複雜度	add()，remove()，contains()方法的時間複雜度是O(1)	add()，remove()，contains()方法的時間複雜度是O(logn)	LinkedHashSet在迭代訪問Set中的全部元素時，效能比HashSet好，但是插入時效能稍微遜色於HashSet，時間複雜度是 O(1)。
同步性	不同步，執行緒不安全	不同步，執行緒不安全	不同步，執行緒不安全
null值	允許null值	不支援null值，會丟擲 java.lang.NullPointerException 異常。因為TreeSet應用 compareTo() 方法於各個元素來比較他們，當比較null值時會丟擲 NullPointerException異常。	允許null值
比較	equals()	compareTo()	equals()

HashSet如何檢查重複

當你把物件加入HashSet時，HashSet會先計算物件的hashcode值來判斷物件加入的位置，同時也會與其他加入的物件的hashcode值作比較，如果沒有相符的hashcode，HashSet會假設物件沒有重複出現。但是如果發現有相同hashcode值的物件，這時會呼叫equals（）方法來檢查hashcode相等的物件是否真的相同。如果兩者相同，HashSet就不會讓加入操作成功。 hashCode（）與equals（）的相關規定：

如果兩個物件相等，則hashcode一定也是相同的
兩個物件相等,對兩個equals方法返回true
兩個物件有相同的hashcode值，它們也不一定是相等的
綜上，equals方法被覆蓋過，則hashCode方法也必須被覆蓋 hashCode()的預設行為是對堆上的物件產生獨特值。如果沒有重寫hashCode()，則該class的兩個物件無論如何都不會相等（即使這兩個物件指向相同的資料）。

總結： HashSet是一個通用功能的Set，而LinkedHashSet 提供元素插入順序保證，TreeSet是一個SortedSet實現，由Comparator 或者 Comparable指定的元素順序儲存元素。

4. Map

Map 是一種把鍵物件和值物件對映的集合，它的每一個元素都包含一對鍵物件和值物件。 Map沒有繼承於Collection介面從Map集合中檢索元素時，只要給出鍵物件，就會返回對應的值物件。 Map 的常用實現類：HashMap、TreeMap、HashTable、LinkedHashMap、ConcurrentHashMap

	HashMap	HashTable
底層實現	陣列+連結串列	陣列+連結串列
同步性	執行緒不同步	同步
null值	允許 key 和 Vale 是 null，但是隻允許一個 key 為 null,且這個元素存放在雜湊表 0 角標位置	不允許key、value 是 null
hash	使用hash(Object key)擾動函式對 key 的 hashCode 進行擾動後作為 hash 值	直接使用 key 的 hashCode() 返回值作為 hash 值
容量	容量為 2^4 且容量一定是 2^n	預設容量是11,不一定是 2^n
擴容	兩倍，且雜湊桶的下標使用 &運算代替了取模	2倍+1，取雜湊桶下標是直接用模運算

幾個問題：

1. HashMap 的工作原理？ 通過hash的方法，通過put和get儲存和獲取物件。儲存物件時，我們將K/V傳給put方法時，它呼叫hashCode計算hash從而得到bucket位置，進一步儲存，HashMap會根據當前bucket的佔用情況自動調整容量(超過Load Facotr則resize為原來的2倍)。獲取物件時，我們將K傳給get，它呼叫hashCode計算hash從而得到bucket位置，並進一步呼叫equals()方法確定鍵值對。如果發生碰撞的時候，Hashmap通過連結串列將產生碰撞衝突的元素組織起來，在Java 8中，如果一個bucket中碰撞衝突的元素超過某個限制(預設是8)，則使用紅黑樹來替換連結串列，從而提高效率。 2.get和put的原理嗎？equals()和hashCode()的都有什麼作用？ 通過對key的hashCode()進行hashing，並計算下標( n-1 & hash)，從而獲得buckets的位置。如果產生碰撞，則利用key.equals()方法去連結串列或樹中去查詢對應的節點 3. HashMap 的長度為什麼是2的冪次方？ 為了能讓 HashMap 存取高效，儘量較少碰撞，也就是要儘量把資料分配均勻，每個連結串列/紅黑樹長度大致相同。這個實現就是把資料存到哪個連結串列/紅黑樹中的演算法。

HashMap 和 LinkedHashMap 的區別

LinkedHashMap 擁有與 HashMap 相同的底層雜湊表結構，即陣列 + 單連結串列 + 紅黑樹，也擁有相同的擴容機制。
LinkedHashMap 相比 HashMap 的拉鍊式儲存結構，內部額外通過 Entry 維護了一個雙向連結串列。
HashMap 元素的遍歷順序不一定與元素的插入順序相同，而 LinkedHashMap 則通過遍歷雙向連結串列來獲取元素，所以遍歷順序在一定條件下等於插入順序。
LinkedHashMap 可以通過構造引數 accessOrder 來指定雙向連結串列是否在元素被訪問後改變其在雙向連結串列中的位置。

HashMap & TreeMap 的區別

HashMap實現了Map介面，不保障元素順序。 TreeMap實現了SortedMap介面，是一個有序的Map。內部採用紅黑樹實現，紅黑樹是一種維護有序資料的高效資料結構

ConcurrentHashMap 和 Hashtable 的區別

ConcurrentHashMap 和 Hashtable 的區別主要體現在實現執行緒安全的方式上不同。底層資料結構： JDK1.7的 ConcurrentHashMap 底層採用分段的陣列+連結串列實現，JDK1.8 採用的資料結構跟HashMap1.8的結構一樣，陣列+連結串列/紅黑二叉樹。Hashtable 和 JDK1.8 之前的 HashMap 的底層資料結構類似都是採用陣列+連結串列的形式，陣列是 HashMap 的主體，連結串列則是主要為了解決雜湊衝突而存在的；實現執行緒安全的方式（重要）： ① 在JDK1.7的時候，ConcurrentHashMap（分段鎖）對整個桶陣列進行了分割分段(Segment)，每一把鎖只鎖容器其中一部分資料，多執行緒訪問容器裡不同資料段的資料，就不會存在鎖競爭，提高併發訪問率。（預設分配16個Segment，比Hashtable效率提高16倍。）到了 JDK1.8 的時候已經摒棄了Segment的概念，而是直接用 Node 陣列+連結串列+紅黑樹的資料結構來實現，併發控制使用 synchronized 和 CAS 來操作。（JDK1.6以後對 synchronized鎖做了很多優化）整個看起來就像是優化過且執行緒安全的 HashMap，雖然在JDK1.8中還能看到 Segment 的資料結構，但是已經簡化了屬性，只是為了相容舊版本；② Hashtable(同一把鎖) :使用 synchronized 來保證執行緒安全，效率非常低下。當一個執行緒訪問同步方法時，其他執行緒也訪問同步方法，可能會進入阻塞或輪詢狀態，如使用 put 新增元素，另一個執行緒不能使用 put 新增元素，也不能使用 get，競爭會越來越激烈效率越低。