HashSet
原始碼解析
public HashSet() {
map = new HashMap<>();
}
private static final Object PRESENT = new Object(); // 這是一個空物件,在HashSet中用來佔位,但本質上仍然是HashMap
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
// Node節點
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Node<K,V> next;
Node(int hash, K key, V value, Node<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
// 開始時tab初始化大小
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// p表示該資料在table中要存放的位置上的節點,如果為空,直接將元素放在那裡
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
// p不為空,說明已經有元素在這了,做進一步比較
else {
Node<K,V> e; K k;
//(1)準備加入的key和p指向的Node結點的key 是同一物件
//(2)p指向的Node結點的key 和準備加入的key equals()比較後相同
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
// 判斷 p 是不是紅黑樹,如果是就呼叫 putTreeVal方法
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
// 依次和該連結串列中的元素比較
for (int binCount = 0; ; ++binCount) {
// 連結串列中最後一個元素,比較完了都沒有一樣的,直接掛在連結串列的後面
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
// 判斷該連結串列是否達到8個結點,呼叫treeifyBin()對這個連結串列進行樹化,
// 注意,轉成紅黑樹時,要進行判斷,條件
// if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
// resize(); 如果條件成立,先擴容table
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break; // 發現 key 相同直接退出
p = e;
}
}
// 存在相同的key
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
// 當增加一個元素(不管是不是在一個連結串列上),都算增加一個,此時超過閾值也會引起擴容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null; // 返回null
}
HashSet的儲存過程:
向HashSet中新增元素 a,首先呼叫元素 a所在類的hashCode方法,計算 a 的雜湊值,此雜湊值透過某種演算法算出 a 在 table Node陣列中存放位置(索引), 判斷此位置上是否已有元素,若此位置為空,直接新增即可; 位置不為空,為連結串列或單元素,則比較 hash值,不一致則新增,一致則呼叫 equals 方法比較,結果為false才新增。
1、HashSet底層是HashMap,第一次新增時,table陣列擴容到16,臨界值(threshold)是 16*載入因子(loadFactor 0.75) = 12
2、如果 table 陣列使用到了臨界值 12, 就會擴容到 16 * 2 = 32, 新的臨界值就是 32 * 0.75 = 24..
3、在java8中,如果一條連結串列的元素個數到達 TREEIFY_THRESHOLD(預設是 8 ),並且 table 的大小 >= MIN_TREEIFY_CAPACITY(預設64), 就會進行樹化,否則仍然採用陣列擴容機制。
測試
定義一個Employee類,該類包含:private成員屬性name,age要求:
認為name和age相同時是相同員工,不能新增到HashSet集合中
public class HashSetTest {
public static void main(String[] args)
{
HashSet hashSet = new HashSet();
}
}
class Employee {
private String name;
private int age;
public Employee(String name, int age)
{
this.name = name;
this.age = age;
}
public String getName()
{
return name;
}
public int getAge()
{
return age;
}
public void setName(String name)
{
this.name = name;
}
public void setAge(int age)
{
this.age = age;
}
public void ToString()
{
.....
}
// 如果name和age相同,返回相同的hash值;
// 注意:但是name和age不相同也有可能返回相同的hash
@Override
public int hashCode() {
return Objects.hash(name, age);
}
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
Employee employee = (Employee) o;
return age == employee.age && Objects.equals(name, employee.name);
}
}