Java并发包之 CopyOnWriteArrayList

大家在学习Java的过程中,或者工作中,始终都绕不开集合。在单线程环境下,ArrayList就可以满足要求。多线程时,我们可以使用CopyOnWriteArrayList来保证数据安全。下面我们一起来看看CopyOnWriteArrayList类中的一些值得学习的方法。

说明:代码部分,均基于JDK1.8

一、添加元素

写时复制思想

CopyOnWrite, 简称COW,顾名思义,就是写入的时候将当前集合复制一份副本出来,新写入的值添加到副本集合里,再将原集合的引用指向新的副本集合。基于这个原理,就可以不加锁实现并发读,因为当前集合并不会添加元素,不会造成冲突。同样的原理还应用在MySQL中创建快照的过程。

	/**
	  * 将指定的元素追加到此列表的末尾
	  *
	  * @param e element to be appended to this list
	  * @return {@code true} (as specified by {@link Collection#add})
	  */
	public boolean add(E e) {
	// 声明可重入锁
        final ReentrantLock lock = this.lock;
	// 加锁
        lock.lock();
        try {
	      // 获取当前数组
            Object[] elements = getArray();
            int len = elements.length;
	      // 复制当前数组到一个新数组中
            Object[] newElements = Arrays.copyOf(elements, len + 1);
	      // 添加元素
            newElements[len] = e;
	      // 改变引用
            setArray(newElements);
            return true;
        } finally {
            lock.unlock();
        }
    }

二、删除元素

ArrayList 遍历过程中删除的问题

大家在学习Java期间,一定都有过使用forEach遍历ArrayList时删除元素都会得到一个java.util.ConcurrentModificationException的错误。这是因为在ArrayList的remove()方法中,有一个参数modCount 专门用来记录修改的次数,每删除一次就modCount++。在forEach遍历集合时,首先会记录final int expectedModCount = modCount,若是遍历过程中发现expectedModCount!=modCount,则会抛出错误。

下面来看看具体代码

    /**
     * 删除元素
     */
    public E remove(int index) {
	// 检查下标是否越界
        rangeCheck(index);
	// 记录修改次数
        modCount++;
	// 待删除的元素
        E oldValue = elementData(index);
	// 待删除元素下标之后的数组长度
        int numMoved = size - index - 1;
        if (numMoved > 0)
	      // 删除元素
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        elementData[--size] = null; // clear to let GC do its work

        return oldValue;
    }

   /**
     * forEach 方法
     */
    @Override
    public void forEach(Consumer<? super E> action) {
        Objects.requireNonNull(action);
	// 记录modCount
        final int expectedModCount = modCount;
        @SuppressWarnings("unchecked")
        final E[] elementData = (E[]) this.elementData;
        final int size = this.size;
	// 遍历时判断modCount
        for (int i=0; modCount == expectedModCount && i < size; i++) {
            action.accept(elementData[i]);
        }
	// 不相同,抛出异常
        if (modCount != expectedModCount) {
            throw new ConcurrentModificationException();
        }
    }

所以使用ArrayList时,如果你有遍历删除某个元素的场景,我们可以使用迭代器来删除。

CopyOnWriteArrayList 的删除

先来看看CopyOnWriteArrayList的remove()方法的源码,整体逻辑与ArrayList的remove()方法一直,有区别的是没有记录修改次数,因为每次删除都是重新获取的当前数组。而forEach()方法在遍历时也是获取的当前数组,因此在使用forEach遍历时删除元素不会抛出异常。

	/**
     * 删除元素
     */
    public E remove(int index) {
        final ReentrantLock lock = this.lock;
	// 加锁
        lock.lock();
        try {
	      // 获取当前数组
            Object[] elements = getArray();
	      // 记录数组的长度
            int len = elements.length;
	      // 记录待删除元素
            E oldValue = get(elements, index);
	      // 记录待删除元素后一个元素到尾节点的长度
            int numMoved = len - index - 1;
	      // 为0代表待删除元素就在数组的末尾
            if (numMoved == 0)
                setArray(Arrays.copyOf(elements, len - 1));
            else {
                Object[] newElements = new Object[len - 1];
		// 复制到新数组中
                System.arraycopy(elements, 0, newElements, 0, index);
                System.arraycopy(elements, index + 1, newElements, index,
                                 numMoved);
		// 改变引用
                setArray(newElements);
            }
            return oldValue;
        } finally {
            lock.unlock();
        }
    }

   /**
     * 遍历方法
     */
    public void forEach(Consumer<? super E> action) {
        if (action == null) throw new NullPointerException();
		// 获取当前数组
        Object[] elements = getArray();
        int len = elements.length;
        for (int i = 0; i < len; ++i) {
            @SuppressWarnings("unchecked") E e = (E) elements[i];
            action.accept(e);
        }
    }

值得注意的是,CopyOnWriteArrayList的迭代器实现里的remove()方法会直接抛出异常,因此在使用迭代器遍历元素时,不能删除元素。

总结

使用场景

基于原理,不难分析出CopyOnWriteArrayList适用于读多写少的并发环境

需要注意的点

因为每次添加元素都需要复制一份副本,所以最好是使用批量添加,减少复制副本的次数

缺点

一、内存占用问题。 因为 CopyOnWrite 的写时复制机制,所以在进行写操作的时候,内存里会同时驻扎两个对象的内存,这一点会占用额外的内存空间。

二、数据一致性问题。 由于 CopyOnWrite 容器的修改是先修改副本,所以这次修改对于其他线程来说,并不是实时能看到的,只有在修改完之后才能体现出来。如果你希望写入的的数据马上能被其他线程看到,CopyOnWrite 容器是不适用的。

Tags: