JAVA集合詳解(Collection和Map介面)

逸卿發表於2014-04-14

在JAVA的util包中有兩個所有集合的父介面Collection和Map,它們的父子關係: 
           java.util
        +Collection 這個介面extends自 --java.lang.Iterable介面
           +List 介面 
              -ArrayList 類
              -LinkedList 類
              -Vector 類     此類是實現同步的

           +Queue 介面
              +不常用,在此不表.

           +Set 介面
              +SortedSet 介面
                 -TreeSet 類
              -HashSet

        +Map 介面
          -HashMap 類 (除了不同步和允許使用 null 鍵/值之外,與 Hashtable 大致相同.)
          -Hashtable 類 此類是實現同步的,不允許使用 null 鍵值
          +SortedMap 介面
             -TreeMap 類

          以下對眾多介面和類的簡單說明:首先不能不先說一下陣列(Array)
       一、Array , Arrays

Java所有“儲存及隨機訪問一連串物件”的做法,array是最有效率的一種。

1、
效率高,但容量固定且無法動態改變。
array還有一個缺點是,無法判斷其中實際存有多少元素,length只是告訴我們array的容量。

2、Java中有一個Arrays類,專門用來操作array。
       arrays中擁有一組static函式,
equals():比較兩個array是否相等。array擁有相同元素個數,且所有對應元素兩兩相等。
fill():將值填入array中。
sort():用來對array進行排序。
binarySearch():在排好序的array中尋找元素。
System.arraycopy():array的複製。


二、Collection , Map

若撰寫程式時不知道究竟需要多少物件,需要在空間不足時自動擴增容量,則需要使用容器類庫,array不適用。

1、Collection 和 Map 的區別

容器內每個為之所儲存的元素個數不同。
Collection型別者,每個位置只有一個元素。
Map型別者,持有 key-value pair,像個小型資料庫。

2、Java2容器類類庫的用途是“儲存物件”,它分為兩類,各自旗下的子類關係

Collection
       --List:將以特定次序儲存元素。所以取出來的順序可能和放入順序不同。
             --ArrayList / LinkedList / Vector
       --Set : 不能含有重複的元素
             --HashSet /TreeSet
Map
       --HashMap
    --HashTable
    --TreeMap

 Map----一組成對的“鍵值對”物件,即其元素是成對的物件,最典型的應用就是資料字典,並且還有其它廣泛的應用。另外,Map可以返回其所有鍵組成的Set和其所有值組成的Collection,或其鍵值對組成的Set,並且還可以像陣列一樣擴充套件多維Map,只要讓Map中鍵值對的每個“值”是一個Map即可。

 Collection下 1.迭代器

  迭代器是一種設計模式,它是一個物件,它可以遍歷並選擇序列中的物件,而開發人員不需要了解該序列的底層結構。迭代器通常被稱為“輕量級”物件,因為建立它的代價小。

  Java中的Iterator功能比較簡單,並且只能單向移動:

  (1) 使用方法iterator()要求容器返回一個Iterator。第一次呼叫Iterator的next()方法時,它返回序列的第一個元素。注意:iterator()方法是java.lang.Iterable介面,被Collection繼承。


  (2) 使用next()獲得序列中的下一個元素。

  (3) 使用hasNext()檢查序列中是否還有元素。

  (4) 使用remove()將迭代器新返回的元素刪除。

  Iterator是Java迭代器最簡單的實現,為List設計的ListIterator具有更多的功能,它可以從兩個方向遍歷List,也可以從List中插入和刪除元素。

  2.List的功能方法

  List(interface): 次序是List最重要的特點;它確保維護元素特定的順序。List為Collection新增了許多方法,使得能夠向List中間插入與移除元素(只推薦LinkedList使用)。一個List可以生成ListIterator,使用它可以從兩個方向遍歷List,也可以從List中間插入和刪除元素。

  ArrayList: 由陣列實現的List。它允許對元素進行快速隨機訪問,但是向List中間插入與移除元素的速度很慢。ListIterator只應該用來由後向前遍歷ArrayList,而不是用來插入和刪除元素,因為這比LinkedList開銷要大很多。

  LinkedList: 由列表實現的List。對順序訪問進行了優化,向List中間插入與刪除得開銷不大,隨機訪問則相對較慢(可用ArrayList代替)。它具有方法addFirst()、addLast()、getFirst()、getLast()、removeFirst()、removeLast(),這些方法(沒有在任何介面或基類中定義過)使得LinkedList可以當作堆疊、佇列和雙向佇列使用。

  3.Set的功能方法

  Set(interface): 存入Set的每個元素必須是唯一的,這也是與List不同的,因為Set不儲存重複元素。加入Set的Object必須定義equals()方法以確保物件的唯一性。Set與Collection有完全一樣的介面。Set介面不保證維護元素的次序。

  HashSet: HashSet能快速定位一個元素,存入HashSet的物件必須定義hashCode()。

  TreeSet: 保持次序的Set,底層為樹結構。使用它可以從Set中提取有序的序列。

  LinkedHashSet: 具有HashSet的查詢速度,且內部使用連結串列維護元素的順序(插入的次序)。於是在使用迭代器遍歷Set時,結果會按元素插入的次序顯示。

  HashSet採用雜湊函式對元素進行排序,這是專門為快速查詢而設計的;TreeSet採用紅黑樹的資料結構進行排序元素;LinkedHashSet內部使用雜湊以加快查詢速度,同時使用連結串列維護元素的次序,使得看起來元素是以插入的順序儲存的。需要注意的是,生成自己的類時,Set需要維護元素的儲存順序,因此要實現Comparable介面並定義compareTo()方法。

3、其他特徵

*     List,Set,Map將持有物件一律視為Object型別。
*     Collection、List、Set、Map都是介面,不能例項化。
      繼承自它們的 ArrayList, Vector, HashTable, HashMap是具象class,這些才可被例項化。
*     vector容器確切知道它所持有的物件隸屬什麼型別。vector不進行邊界檢查。


三、Collections

Collections是針對集合類的一個幫助類。提供了一系列靜態方法實現對各種集合的搜尋、排序、執行緒完全化等操作。
相當於對Array進行類似操作的類——Arrays。
如,Collections.max(Collection coll); 取coll中最大的元素。
       Collections.sort(List list); 對list中元素排序


四、如何選擇?

1、容器類和Array的區別、擇取
      *     容器類僅能持有物件引用(指向物件的指標),而不是將物件資訊copy一份至數列某位置。
      *     一旦將物件置入容器內,便損失了該物件的型別資訊。

2、
     *     在各種Lists中,最好的做法是以ArrayList作為預設選擇。當插入、刪除頻繁時,使用LinkedList();
        Vector總是比ArrayList慢,所以要儘量避免使用。
     *     在各種Sets中,HashSet通常優於HashTree(插入、查詢)。只有當需要產生一個經過排序的序列,才用TreeSet。
        HashTree存在的唯一理由:能夠維護其內元素的排序狀態。
     *     在各種Maps中
        HashMap用於快速查詢。
     *     當元素個數固定,用Array,因為Array效率是最高的。


結論:最常用的是ArrayList,HashSet,HashMap,Array。而且,我們也會發現一個規律,用TreeXXX都是排序的。


注意:

1、Collection沒有get()方法來取得某個元素。只能通過iterator()遍歷元素。
2、Set和Collection擁有一模一樣的介面。
3、List,可以通過get()方法來一次取出一個元素。使用數字來選擇一堆物件中的一個,get(0)...。(add/get)
4、一般使用ArrayList。用LinkedList構造堆疊stack、佇列queue。

5、Map用 put(k,v) / get(k),還可以使用containsKey()/containsValue()來檢查其中是否含有某個key/value。
      HashMap會利用物件的hashCode來快速找到key。
    *     hashing
          雜湊碼就是將物件的資訊經過一些轉變形成一個獨一無二的int值,這個值儲存在一個array中。
          我們都知道所有儲存結構中,array查詢速度是最快的。所以,可以加速查詢。
      
          發生碰撞時,讓array指向多個values。即,陣列每個位置上又生成一個槤表。

6、Map中元素,可以將key序列、value序列單獨抽取出來。
使用keySet()抽取key序列,將map中的所有keys生成一個Set。
使用values()抽取value序列,將map中的所有values生成一個Collection。

為什麼一個生成Set,一個生成Collection?那是因為,key總是獨一無二的,value允許重複。


相關文章