java中Map,List與Set的區別

dawn009發表於2015-04-29

先看一張圖(圖來自蘭亭風雨的專欄)

Set,List,Map的區別

java集合的主要分為三種型別:

  • Set(集)
  • List(列表)
  • Map(對映)
要深入理解集合首先要了解下我們熟悉的陣列:

陣列是大小固定的,並且同一個陣列只能存放型別一樣的資料(基本型別/引用型別),而JAVA集合可以儲存和運算元目不固定的一組資料。 所有的JAVA集合都位於 java.util包中!

JAVA集合只能存放引用型別的的資料,不能存放基本資料型別。

簡單說下集合和陣列的區別:(參考文章:《Thinking In Algorithm》03.資料結構之陣列)

世間上本來沒有集合,(只有陣列參考C語言)但有人想要,所以有了集合  

有人想有可以自動擴充套件的陣列,所以有了List  

有的人想有沒有重複的陣列,所以有了set  

有人想有自動排序的組數,所以有了TreeSet,TreeList,Tree**  

  

而幾乎有有的集合都是基於陣列來實現的.  

因為集合是對陣列做的封裝,所以,陣列永遠比任何一個集合要快  

  

但任何一個集合,比陣列提供的功能要多  

一:陣列宣告瞭它容納的元素的型別,而集合不宣告。這是由於集合以object形式來儲存它們的元素。 

二:一個陣列例項具有固定的大小,不能伸縮。集合則可根據需要動態改變大小。 

三:陣列是一種可讀/可寫資料結構---沒有辦法建立一個只讀陣列。然而可以使用集合提供的ReadOnly方法,以只讀方式來使用集合。該方法將返回一個集合的只讀版本。

Java所有“儲存及隨機訪問一連串物件”的做法,array是最有效率的一種。

1、效率高,但容量固定且無法動態改變。

array還有一個缺點是,無法判斷其中實際存有多少元素,length只是告訴我們array的容量。

2、Java中有一個Arrays類,專門用來操作array

arrays中擁有一組static函式,

equals():比較兩個array是否相等。array擁有相同元素個數,且所有對應元素兩兩相等。

fill():將值填入array中。

sort():用來對array進行排序。

binarySearch():在排好序的array中尋找元素。

System.arraycopy():array的複製。

 

若撰寫程式時不知道究竟需要多少物件,需要在空間不足時自動擴增容量,則需要使用容器類庫,array不適用。所以就要用到集合。

那我們開始討論java中的集合。

集合分類:

Collection:List、Set

Map:HashMap、HashTable

 

 

1.1 Collection介面

Collection是最基本的集合介面,宣告瞭適用於JAVA集合(只包括Set和List)的通用方法。 Set 和List 都繼承了Conllection,Map。

1.1.1  Collection介面的方法:

  1. boolean add(Object o)      :向集合中加入一個物件的引用
  2. void clear():刪除集合中所有的物件,即不再持有這些物件的引用
  3. boolean isEmpty()    :判斷集合是否為空
  4. boolean contains(Object o) : 判斷集合中是否持有特定物件的引用
  5. Iterartor iterator()  :返回一個Iterator物件,可以用來遍歷集合中的元素
  6. boolean remove(Object o) :從集合中刪除一個物件的引用
  7. int size()       :返回集合中元素的數目
  8. Object[] toArray()    : 返回一個陣列,該陣列中包括集合中的所有元素 </span>

關於:Iterator() 和toArray() 方法都用於集合的所有的元素,前者返回一個Iterator物件,後者返回一個包含集合中所有元素的陣列。

 

1.1.2  Iterator介面宣告瞭如下方法:

  1. hasNext():判斷集合中元素是否遍歷完畢,如果沒有,就返回true
  2. next() :返回下一個元素
  3. remove():從集合中刪除上一個有next()方法返回的元素。

 

1.2  Set(集合)

Set是最簡單的一種集合。集合中的物件不按特定的方式排序,並且沒有重複物件。 Set介面主要實現了兩個實現類:

  • HashSet: HashSet類按照雜湊演算法來存取集合中的物件,存取速度比較快
  • TreeSet :TreeSet類實現了SortedSet介面,能夠對集合中的物件進行排序。

Set 的用法:存放的是物件的引用,沒有重複物件

  1. Set set = new HashSet();
  2. String s1 = new String("hello");
  3. String s2 = new String("hello");
  4. String s3 = new String("hello");
  5. boolean a = set.add(s1);//true
  6. boolean b = set.add(s2);//false
  7. boolean c = set.add(s3);//false
  8. System.out.println(set.size());//1

HashSet 的 add()方法是如何判斷物件是否已經存放在集合中?

我們檢視 HashSet的實現,發現它是直接底層的HashMap。

 

Set的功能方法 

Set具有與Collection完全一樣的介面,因此沒有任何額外的功能,不像前面有兩個不同的List。實際上Set就是Collection,只 是行為不同。(這是繼承與多型思想的典型應用:表現不同的行為。)Set不儲存重複的元素(至於如何判斷元素相同則較為負責)

 

Set : 存入Set的每個元素都必須是唯一的,因為Set不儲存重複元素。加入Set的元素必須定義equals()方法以確保物件的唯一性。Set與Collection有完全一樣的介面。Set介面不保證維護元素的次序。 

  • HashSet:為快速查詢設計的Set。存入HashSet的物件必須定義hashCode()。
  • TreeSet: 儲存次序的Set, 底層為樹結構。使用它可以從Set中提取有序的序列。

 

LinkedHashSet:具有HashSet的查詢速度,且內部使用連結串列維護元素的順序(插入的次序)。於是在使用迭代器遍歷Set時,結果會按元素插入的次序顯示。

 

1.3  List(列表)

List的特徵是其元素以線性方式儲存,集合中可以存放重複物件。

List介面主要實現類包括:(參考文章:ArrayList與LinkedList的區別

  • ArrayList() : 代表長度可以改變得陣列。可以對元素進行隨機的訪問,向ArrayList()中插入與刪除元素的速度慢。
  • LinkedList(): 在實現中採用連結串列資料結構。插入和刪除速度快,訪問速度慢。

對於List的隨機訪問來說,就是隻隨機來檢索位於特定位置的元素。 List 的 get(int index) 方法放回集合中由引數index指定的索引位置的物件,下標從“0” 開始。最基本的兩種檢索集合中的所有物件的方法:

1: for迴圈和get()方法:

  1. for(int i=0; i<list.size();i++){
  2.      System.out.println(list.get(i));
  3. }

 

2: 使用 迭代器(Iterator):

  1. Iterator it=list.iterator();
  2. while(it.hashNext()){
  3.     System.out.println(it.next());
  4. }

 

List的功能方法

實際上有兩種List:一種是基本的ArrayList,其優點在於隨機訪問元素;另一種是更強大的LinkedList,它並不是為快速隨機訪問設計的,而是具有一套更通用的方法。

  • List:次序是List最重要的特點:它保證維護元素特定的順序。List為Collection新增了許多方法,使得能夠向List中間插入與移除元素(這隻推 薦LinkedList使用。)一個List可以生成ListIterator,使用它可以從兩個方向遍歷List,也可以從List中間插入和移除元 素。
  • ArrayList:由陣列實現的List。允許對元素進行快速隨機訪問,但是向List中間插入與移除元素的速度很慢。ListIterator只應該用來由後向前遍歷 ArrayList,而不是用來插入和移除元素。因為那比LinkedList開銷要大很多。
  • LinkedList :對順序訪問進行了優化,向List中間插入與刪除的開銷並不大。隨機訪問則相對較慢。(使用ArrayList代替。)還具有下列方 法:addFirst(), addLast(), getFirst(), getLast(), removeFirst() 和 removeLast(), 這些方法 (沒有在任何介面或基類中定義過)使得LinkedList可以當作堆疊、佇列和雙向佇列使用。

 

1.4 Map(對映)

Map 是一種把鍵物件和值物件對映的集合,它的每一個元素都包含一對鍵物件和值物件。 Map沒有繼承於Collection介面 從Map集合中檢索元素時,只要給出鍵物件,就會返回對應的值物件。 

Map 的常用方法:

1 新增,刪除操作:

  1. Object put(Object key, Object value): 向集合中加入元素
  2. Object remove(Object key): 刪除與KEY相關的元素
  3.  void putAll(Map t):  將來自特定映像的所有元素新增給該映像
  4.  void clear():從映像中刪除所有對映

2 查詢操作:

Object get(Object key):獲得與關鍵字key相關的值 。Map集合中的鍵物件不允許重複,也就說,任意兩個鍵物件通過equals()方法比較的結果都是false.,但是可以將任意多個鍵獨享對映到同一個值物件上

Map的功能方法

方法put(Object key, Object value)新增一個“值”(想要得東西)和與“值”相關聯的“鍵”(key)(使用它來查詢)。方法get(Object key)返回與給定“鍵”相關聯的“值”。可以用containsKey()和containsValue()測試Map中是否包含某個“鍵”或“值”。 標準的Java類庫中包含了幾種不同的Map:HashMap, TreeMap, LinkedHashMap, WeakHashMap, IdentityHashMap。它們都有同樣的基本介面Map,但是行為、效率、排序策略、儲存物件的生命週期和判定“鍵”等價的策略等各不相同。

執行效率是Map的一個大問題。看看get()要做哪些事,就會明白為什麼在ArrayList中搜尋“鍵”是相當慢的。而這正是HashMap提高速 度的地方。HashMap使用了特殊的值,稱為“雜湊碼”(hash code),來取代對鍵的緩慢搜尋。“雜湊碼”是“相對唯一”用以代表物件的int值,它是通過將該物件的某些資訊進行轉換而生成的。所有Java物件都 能產生雜湊碼,因為hashCode()是定義在基類Object中的方法。

HashMap就是使用物件的hashCode()進行快速查詢的。此方法能夠顯著提高效能。 

Map : 維護“鍵值對”的關聯性,使你可以通過“鍵”查詢“值”

HashMap:Map基於雜湊表的實現。插入和查詢“鍵值對”的開銷是固定的。可以通過構造器設定容量capacity和負載因子load factor,以調整容器的效能。

LinkedHashMap: 類似於HashMap,但是迭代遍歷它時,取得“鍵值對”的順序是其插入次序,或者是最近最少使用(LRU)的次序。只比HashMap慢一點。而在迭代訪問時發而更快,因為它使用連結串列維護內部次序。

TreeMap : 基於紅黑樹資料結構的實現。檢視“鍵”或“鍵值對”時,它們會被排序(次序由Comparabel或Comparator決定)。TreeMap的特點在 於,你得到的結果是經過排序的。TreeMap是唯一的帶有subMap()方法的Map,它可以返回一個子樹。

WeakHashMao :弱鍵(weak key)Map,Map中使用的物件也被允許釋放: 這是為解決特殊問題設計的。如果沒有map之外的引用指向某個“鍵”,則此“鍵”可以被垃圾收集器回收。

IdentifyHashMap: : 使用==代替equals()對“鍵”作比較的hash map。專為解決特殊問題而設計。

1.4 區別

1.4.1、Collection 和 Map 的區別

容器內每個為之所儲存的元素個數不同。
Collection型別者,每個位置只有一個元素。
Map型別者,持有 key-value pair,像個小型資料庫。

1.4.2、各自旗下的子類關係

Collection
     --List:將以特定次序儲存元素。所以取出來的順序可能和放入順序不同。
--ArrayList / LinkedList / Vector
--Set : 不能含有重複的元素
--HashSet / TreeSet
      Map
--HashMap
--HashTable
--TreeMap

1.4.3、其他特徵

List,Set,Map將持有物件一律視為Object型別。

Collection、List、Set、Map都是介面,不能例項化。

繼承自它們的 ArrayList, Vector, HashTable, HashMap是具象class,這些才可被例項化。

vector容器確切知道它所持有的物件隸屬什麼型別。vector不進行邊界檢查。

總結

1. 如果涉及到堆疊,佇列等操作,應該考慮用List,對於需要快速插入,刪除元素,應該使用LinkedList,如果需要快速隨機訪問元素,應該使用ArrayList。

2. 如果程式在單執行緒環境中,或者訪問僅僅在一個執行緒中進行,考慮非同步的類,其效率較高,如果多個執行緒可能同時操作一個類,應該使用同步的類。

3. 在除需要排序時使用TreeSet,TreeMap外,都應使用HashSet,HashMap,因為他們的效率更高。

4. 要特別注意對雜湊表的操作,作為key的物件要正確複寫equals和hashCode方法。

5. 容器類僅能持有物件引用(指向物件的指標),而不是將物件資訊copy一份至數列某位置。一旦將物件置入容器內,便損失了該物件的型別資訊。

6. 儘量返回介面而非實際的型別,如返回List而非ArrayList,這樣如果以後需要將ArrayList換成LinkedList時,客戶端程式碼不用改變。這就是針對抽象程式設計。

注意:

1、Collection沒有get()方法來取得某個元素。只能通過iterator()遍歷元素。

2、Set和Collection擁有一模一樣的介面。

3、List,可以通過get()方法來一次取出一個元素。使用數字來選擇一堆物件中的一個,get(0)...。(add/get)

4、一般使用ArrayList。用LinkedList構造堆疊stack、佇列queue。

5、Map用 put(k,v) / get(k),還可以使用containsKey()/containsValue()來檢查其中是否含有某個key/value。

HashMap會利用物件的hashCode來快速找到key。

6、Map中元素,可以將key序列、value序列單獨抽取出來。

使用keySet()抽取key序列,將map中的所有keys生成一個Set。

使用values()抽取value序列,將map中的所有values生成一個Collection。

為什麼一個生成Set,一個生成Collection?那是因為,key總是獨一無二的,value允許重複。

7、有序集合的包括 Tree系列,即 TreeSet,TreeMap 還有 LinkedHashMap。 

 

Reference:

http://developer.51cto.com/art/201309/410205_all.htm

http://billy-lee.iteye.com/blog/356398

 

原文地址:http://blog.csdn.net/speedme/article/details/22398395

相關文章