问题
-
WeakHashMap使用的数据结构?
-
WeakHashMap具有什么特性?
-
WeakHashMap的用处?
-
WeakHashMap使用String作为key是需要注意些什么?为什么?
-
什么是弱引用?
简述
WeakHashMap
是一种弱引用
map,内部的key会存储为弱引用,当jvm gc
的时候,如果这些key没有强引用
存在的话,会被gc回收掉,
下一次当我们操作map的时候会把对应的Entry整个删除掉,基于这种特性,WeakHashMap特别适用于缓存处理
。
-
强引用(Strong Reference)
:普通的的引用类型,new一个对象默认得到的引用就是强引用
,只要对象存在强引用,就不会被GC。(A a = new A())
-
软引用(Soft Reference)
:相对较弱的引用,垃圾回收器会在内存不足
时回收弱引用指向的对象。JVM会在抛出OOME前清理所有弱引用指向的对象,如果清理完还是内存不足, 才会抛出OOME。所以软引用一般用于实现内存敏感缓存
。 -
弱引用(Weak Reference)
:更弱的引用类型,垃圾回收器在GC时会回收此对象,也可以用于实现缓存,比如JDK提供的WeakHashMap
。 -
虚引用(Phantom Reference)
:一种特殊的引用类型,不能通过虚引用获取到关联对象,只是用于获取对象被回收的通知
。
源码分析
Map 类图
属性
//默认初始容量为16
private static final int DEFAULT_INITIAL_CAPACITY = 16;
//最大容量1073741824
private static final int MAXIMUM_CAPACITY = 1 << 30;
//默认的加载因子(扩容因子)
private static final float DEFAULT_LOAD_FACTOR = 0.75f;
//桶
Entry<K,V>[] table;
//元素个数
private int size;
//当桶的使用数量达到多少时进行扩容,threshold = capacity * loadFactor 默认是 12 = 16 * 0.75
private int threshold;
//加载因子
private final float loadFactor;
//引用队列
private final ReferenceQueue<Object> queue = new ReferenceQueue<>();
上面的属性基本上和HashMap是一样。
WeakHashMap
是一种弱引用
map,则是通过ReferenceQueue
来实现的当弱键失效的时候会把Entry添加到这个队列中,当下次访问map的时候会把失效的Entry清除掉。
Entry内部类
WeakHashMap内部的存储节点, 没有key属性。
private static class Entry<K,V> extends WeakReference<Object> implements Map.Entry<K,V> {
//可以发现没有key, 因为key是作为弱引用存到Reference类中
V value;
final int hash;
Entry<K,V> next;
/**
* Creates new entry.
*/
Entry(Object key, V value,
ReferenceQueue<Object> queue,
int hash, Entry<K,V> next) {
//调用WeakReference的构造方法初始化key和引用队列
super(key, queue);
this.value = value;
this.hash = hash;
this.next = next;
}
}
//java.lang.ref.WeakReference
public WeakReference(T referent, ReferenceQueue<? super T> q) {
super(referent, q);
}
//java.lang.ref.reference
public abstract class Reference<T> {
//实际存储key的地方
private T referent; /* Treated specially by GC */
//引用队列
volatile ReferenceQueue<? super T> queue;
Reference(T referent, ReferenceQueue<? super T> queue) {
this.referent = referent;
this.queue = (queue == null) ? ReferenceQueue.NULL : queue;
}
}
从Entry的构造方法我们知道,key和queue最终会传到到Reference的构造方法中,这里的key就是Reference的referent属性,
它会被gc特殊对待,即当没有强引用存在时,当下一次gc
的时候会被清除。
构造方法
public WeakHashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal Initial Capacity: "+
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal Load factor: "+
loadFactor);
int capacity = 1;
while (capacity < initialCapacity)
capacity <<= 1;
table = newTable(capacity);
this.loadFactor = loadFactor;
threshold = (int)(capacity * loadFactor);
}
public WeakHashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
public WeakHashMap() {
this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);
}
public WeakHashMap(Map<? extends K, ? extends V> m) {
this(Math.max((int) (m.size() / DEFAULT_LOAD_FACTOR) + 1,
DEFAULT_INITIAL_CAPACITY),
DEFAULT_LOAD_FACTOR);
putAll(m);
}
构造方法与HashMap
基本类似,初始容量为大于等于传入容量最近的2的n次方,扩容门槛threshold等于capacity * loadFactor。
put(K key, V value)方法
添加元素
public V put(K key, V value) {
//如果key为空,用空对象代替
Object k = maskNull(key);
//计算key 的hash值
int h = hash(k);
//获取桶
Entry<K,V>[] tab = getTable();
//<1> 计算元素在哪个桶中,h & (length-1)
int i = indexFor(h, tab.length);
//<2> 遍历桶对应的链表
for (Entry<K,V> e = tab[i]; e != null; e = e.next) {
//<2.1> 如果找到了元素就使用新值替换旧值,并返回旧值
if (h == e.hash && eq(k, e.get())) {
V oldValue = e.value;
if (value != oldValue)
e.value = value;
return oldValue;
}
}
modCount++;
//<2.2> 如果没找到就把新值插入到链表的头部
Entry<K,V> e = tab[i];
tab[i] = new Entry<>(k, value, queue, h, e);
//<3> 如果插入元素后数量达到了扩容门槛就把桶的数量扩容为2倍大小
if (++size >= threshold)
resize(tab.length * 2);
return null;
}
(1) 计算hash
- 这里与HashMap有所不同,HashMap中如果key为空直接返回0,这里是用空对象来计算的。
- 另外打散方式也不同,HashMap只用了一次异或,这里用了四次,HashMap给出的解释是一次够了,而且就算冲突了也会转换成红黑树,对效率没什么影响。
(2) 计算在哪个桶中
(3) 遍历桶对应的链表;
(4) 如果找到元素就用新值替换旧值,并返回旧值
(5) 如果没找到就在链表头部
插入新元素,HashMap就插入到链表尾部
。
(6) 如果元素数量达到了扩容门槛,就把容量扩大到2倍大小;HashMap中是大于
threshold才扩容,这里等于
threshold就开始扩容了。
resize(int newCapacity)方法
扩容
void resize(int newCapacity) {
//<1> 获取旧桶,getTable()的时候会剔除失效的Entry
Entry<K,V>[] oldTable = getTable();
//旧容量
int oldCapacity = oldTable.length;
if (oldCapacity == MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return;
}
// 新桶
Entry<K,V>[] newTable = newTable(newCapacity);
//<2> 把元素从旧桶转移到新桶
transfer(oldTable, newTable);
//<3> 把新桶赋值桶变量
table = newTable;
/*
* If ignoring null elements and processing ref queue caused massive
* shrinkage, then restore old table. This should be rare, but avoids
* unbounded expansion of garbage-filled tables.
*/
//<4> 如果元素个数大于扩容门槛的一半,则使用新桶和新容量,并计算新的扩容门槛
if (size >= threshold / 2) {
threshold = (int)(newCapacity * loadFactor);
} else {
// 否则把元素再转移回旧桶,还是使用旧桶
// 因为在transfer的时候会清除失效的Entry,所以元素个数可能没有那么大了,就不需要扩容了
expungeStaleEntries();
transfer(newTable, oldTable);
table = oldTable;
}
}
//在resize <2>中 把元素从旧桶转移到新桶
private void transfer(Entry<K,V>[] src, Entry<K,V>[] dest) {
//遍历旧桶
for (int j = 0; j < src.length; ++j) {
Entry<K,V> e = src[j];
src[j] = null;
while (e != null) {
Entry<K,V> next = e.next;
Object key = e.get();
//如果key等于了null就清除,说明key被gc清理掉了,则把整个Entry清除
if (key == null) {
e.next = null; // Help GC
e.value = null; // " "
size--;
} else {
//否则就计算在新桶中的位置并把这个元素放在新桶对应链表的头部
int i = indexFor(e.hash, dest.length);
e.next = dest[i];
dest[i] = e;
}
e = next;
}
}
}
(1) 判断旧容量是否达到最大容量;
(2) 新建新桶并把元素全部转移到新桶中;
(3) 如果转移后元素个数不到扩容门槛的一半,则把元素再转移回旧桶,继续使用旧桶,说明不需要扩容;
(4) 否则使用新桶,并计算新的扩容门槛;
(5) 转移元素的过程中会把key为null的元素清除掉,所以size会变小;
get(Object key)方法
获取元素
public V get(Object key) {
Object k = maskNull(key);
// 计算hash
int h = hash(k);
Entry<K,V>[] tab = getTable();
int index = indexFor(h, tab.length);
Entry<K,V> e = tab[index];
// 遍历链表,找到了就返回
while (e != null) {
if (e.hash == h && eq(k, e.get()))
return e.value;
e = e.next;
}
return null;
}
(1) 计算hash值;
(2) 遍历所在桶对应的链表;
(3) 如果找到了就返回元素的value值;
(4) 如果没找到就返回空;
remove(Object key)方法
public V remove(Object key) {
Object k = maskNull(key);
// 计算hash
int h = hash(k);
Entry<K,V>[] tab = getTable();
//元素所在的桶的第一个元素
int i = indexFor(h, tab.length);
Entry<K,V> prev = tab[i];
Entry<K,V> e = prev;
//遍历链表
while (e != null) {
Entry<K,V> next = e.next;
//如果找到了就删除元素
if (h == e.hash && eq(k, e.get())) {
modCount++;
size--;
if (prev == e)
//如果是头节点,就把头节点指向下一个节点
tab[i] = next;
else
//如果不是头节点,删除该节点
prev.next = next;
return e.value;
}
prev = e;
e = next;
}
return null;
}
(1) 计算hash;
(2) 找到所在的桶;
(3) 遍历桶对应的链表;
(4) 如果找到了就删除该节点,并返回该节点的value值;
(5) 如果没找到就返回null;
expungeStaleEntries()方法
剔除失效的Entry
private void expungeStaleEntries() {
//遍历引用队列
for (Object x; (x = queue.poll()) != null; ) {
synchronized (queue) {
@SuppressWarnings("unchecked")
Entry<K,V> e = (Entry<K,V>) x;
//找到所在的桶
int i = indexFor(e.hash, table.length);
Entry<K,V> prev = table[i];
Entry<K,V> p = prev;
//遍历链表
while (p != null) {
Entry<K,V> next = p.next;
//找到该元素
if (p == e) {
//删除该元素
if (prev == e)
table[i] = next;
else
prev.next = next;
// Must not null out e.next;
// stale entries may be in use by a HashIterator
e.value = null; // Help GC
size--;
break;
}
prev = p;
p = next;
}
}
}
}
(1) 当key失效的时候gc会自动把对应的Entry添加到这个引用队列中;
(2) 所有对map的操作都会直接或间接地调用到这个方法先移除失效的Entry,比如getTable()、size()、resize();
(3) 这个方法的目的就是遍历引用队列,并把其中保存的Entry从map中移除掉,具体的过程请看类注释;
(4) 从这里可以看到移除Entry的同时把value也一并置为null帮助gc清理元素,防御性编程。
总结
-
WeakHashMap使用(数组 + 链表)存储结构
-
WeakHashMap中的key是弱引用,gc的时候会被清除
-
每次对map的操作都会剔除失效key对应的Entry
-
使用String作为key时,一定要使用new String()这样的方式声明key,才会失效,其它的基本类型的包装类型是一样的
- 字符串
"weak"
如果使用这样作为key会被加入到字符串常量池
中,不会被清理
- 字符串