jdk源码-Map与HashTable
- 2019 年 10 月 30 日
- 笔记
Map
map是一个接口,是一个映射着key和value关系的容器,从定义上看,map不能包含重复的key,一个key最多只能映射一个value。map是否有序取决于它的实现类,treeMap是有序的,hashmap是无序的。
对于map不支持的操作,会报UnsupportedOperationException
。
map接口不会限制key和value是否可以为null
,不会限制一定用equals
or hashCode
判断key是否相等,这都取决于具体的实现类。
map有get(Object key)
,put(key, value)
,replace(key, value)
,remove(key)
,entrySet()
,keySet()
等方法。都是通过key来查找,替换value。
HashTable
Hashtable继承Dictionary,实现Map接口,是一个不推荐使用的Map实现类。Dictionary是1.2推出,用于存键值对的抽象类,已经废弃。

Hashtable的数据结构是数组加链表,它是并发安全的。下面说说它的数据结构与get(key)
,put(key, value)
,remove(key)
,keySet()
都是如何实现的。
数据结构:Hashtable
的数据结构实际是数组加链表,即使用数组存储,数组的每个item都是一个链表对象。之所以这么设计的原因是Object采用(key.hashcode & 0x7FFFFFFF) % tab.length
来定位Object存放下标,但是两个对象的hashCode可能相同,两个不同hashCode& 0x7FFFFFFF也可能相同,取余也可能会相同,对于index相同key,就采用链表的方式去存了。
private transient Entry<?,?>[] table; private static class Entry<K,V> implements Map.Entry<K,V> { final int hash; final K key; V value; Entry<K,V> next; }
既然hashTable存的是数组,那就肯定要涉及到数组的初始化长度和扩容策略了。hashTable数组默认长度是11,扩容阀值是0.75,每次扩容长度为length*2+1。即当hashTable中的元素数达到table.length*阀值(0.75)时,就会触发扩容,它会创建一个新的数组,长度为length*2+1,并对所有元素进行重新定位。扩容机制发生在put方法,所以put(value)方法效率可能会很慢(发生扩容)。
// hashTable会默认加载一个长度为11的数组 public Hashtable() { this(11, 0.75f); }
public Hashtable(int initialCapacity, float loadFactor) { if (initialCapacity < 0) throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity); if (loadFactor <= 0 || Float.isNaN(loadFactor)) throw new IllegalArgumentException("Illegal Load: "+loadFactor); if (initialCapacity==0) initialCapacity = 1; this.loadFactor = loadFactor; table = new Entry<?,?>[initialCapacity]; threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1); }
put方法:通过(key.hashcode & 0x7FFFFFFF) % tab.length
来定位数组下标,获下标对于链表,通过key.equals
判断可以相同的对象,将key,value放入新Entry对象并替换原对象并跳出方法;进入添加元素方法,判断元素长度是否超过阀值,定位到数组index,构造新Entry对象并插入到链表头节点。
插入链表头节点是最简单的操作,e.next = (Entry<K,V>)newMap[index]; newMap[index] = e;
public synchronized V put(K key, V value) { // Make sure the value is not null if (value == null) { throw new NullPointerException(); } // Makes sure the key is not already in the hashtable. Entry<?,?> tab[] = table; // key不可为null int hash = key.hashCode(); // 获得一个小于int最大值的数,0x7FFFFFFF int最大值 int index = (hash & 0x7FFFFFFF) % tab.length; @SuppressWarnings("unchecked") Entry<K,V> entry = (Entry<K,V>)tab[index]; for(; entry != null ; entry = entry.next) { if ((entry.hash == hash) && entry.key.equals(key)) { V old = entry.value; entry.value = value; return old; } } addEntry(hash, key, value, index); return null; }
private void addEntry(int hash, K key, V value, int index) { modCount++; Entry<?,?> tab[] = table; if (count >= threshold) { // 扩容并重新hash定位 rehash(); tab = table; hash = key.hashCode(); index = (hash & 0x7FFFFFFF) % tab.length; } @SuppressWarnings("unchecked") Entry<K,V> e = (Entry<K,V>) tab[index]; tab[index] = new Entry<>(hash, key, value, e); count++; }
protected void rehash() { int oldCapacity = table.length; Entry<?,?>[] oldMap = table; // 扩容 int newCapacity = (oldCapacity << 1) + 1; if (newCapacity - MAX_ARRAY_SIZE > 0) { if (oldCapacity == MAX_ARRAY_SIZE) // Keep running with MAX_ARRAY_SIZE buckets return; newCapacity = MAX_ARRAY_SIZE; } Entry<?,?>[] newMap = new Entry<?,?>[newCapacity]; modCount++; threshold = (int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE + 1); table = newMap; for (int i = oldCapacity ; i-- > 0 ;) { for (Entry<K,V> old = (Entry<K,V>)oldMap[i] ; old != null ; ) { Entry<K,V> e = old; old = old.next; int index = (e.hash & 0x7FFFFFFF) % newCapacity; e.next = (Entry<K,V>)newMap[index]; newMap[index] = e; } } }
get(key)的实现逻辑是通过hash找到数组index,在遍历index对应的链表,通过equals判读相同的key。
public synchronized V get(Object key) { Entry<?,?> tab[] = table; int hash = key.hashCode(); int index = (hash & 0x7FFFFFFF) % tab.length; for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) { if ((e.hash == hash) && e.key.equals(key)) { return (V)e.value; } } return null; }
remove(key)实现也很简单,通过hash找到数组index,在遍历这个链表,找到equals的key,接着把上一个节点的指针指向要删除节点的next,对象赋空。
public synchronized V remove(Object key) { Entry<?,?> tab[] = table; int hash = key.hashCode(); int index = (hash & 0x7FFFFFFF) % tab.length; @SuppressWarnings("unchecked") Entry<K,V> e = (Entry<K,V>)tab[index]; for(Entry<K,V> prev = null ; e != null ; prev = e, e = e.next) { if ((e.hash == hash) && e.key.equals(key)) { modCount++; if (prev != null) { prev.next = e.next; } else { tab[index] = e.next; } count--; V oldValue = e.value; e.value = null; return oldValue; } } return null; }
keySet()是获所有的key,对map进行迭代的一个处理。HashTable的keySet是这么做处理的。HashTable自己显现了一个keySet类,但它只是一个空架子,真正的实现在迭代器方法中,而迭代器返回的是HashTable实现的一个内部类Enumerator。实现和运行逻辑是
private class Enumerator<T> implements Enumeration<T>, Iterator<T> { // map的数组 Entry<?,?>[] table = Hashtable.this.table; // 迭代到哪一个下标 int index = table.length; // 目前迭代的对象 Entry<?,?> entry; // 上次返回的对象 Entry<?,?> lastReturned; // 迭代key还是value int type; boolean iterator; protected int expectedModCount = modCount; Enumerator(int type, boolean iterator) { this.type = type; this.iterator = iterator; } //1.判断当前元素是否有next,2.在数组中index到0去遍历,如果都是null,则没有下个元素。 public boolean hasMoreElements() { Entry<?,?> e = entry; int i = index; Entry<?,?>[] t = table; /* Use locals for faster loop iteration */ while (e == null && i > 0) { e = t[--i]; } entry = e; index = i; return e != null; } // 当前返回entry不为空时,直接返回entry,并把entry赋值成next;数组倒叙遍历到不是null的,把这个node赋值给entry,赋值数组下标,返回entry,并把entry赋值成next @SuppressWarnings("unchecked") public T nextElement() { Entry<?,?> et = entry; int i = index; Entry<?,?>[] t = table; /* Use locals for faster loop iteration */ while (et == null && i > 0) { et = t[--i]; } entry = et; index = i; if (et != null) { Entry<?,?> e = lastReturned = entry; entry = e.next; return type == KEYS ? (T)e.key : (type == VALUES ? (T)e.value : (T)e); } throw new NoSuchElementException("Hashtable Enumerator"); } public boolean hasNext() { return hasMoreElements(); } public T next() { if (modCount != expectedModCount) throw new ConcurrentModificationException(); return nextElement(); } }
HashTable是线程安全的,原因是在每个方法前都加上了synchronized,故而它最多支持一个线程操作。