CopyOnWriteArrayList 实现原理

张开发
2026/4/12 2:12:47 15 分钟阅读

分享文章

CopyOnWriteArrayList 实现原理
什么是CopyOnWriteArrayListCopyOnWriteArrayList是 Java 并发包 (java.util.concurrent) 中一个非常独特且重要的线程安全集合。与Collections.synchronizedList不同CopyOnWriteArrayList不依赖外部同步而是通过内部机制实现并发控制它专为“读多写少”的极端场景设计通过一种巧妙的“写时复制”策略在保证线程安全的同时实现了极高的读性能。核心思想写时复制CopyOnWriteArrayList的核心思想是读写分离。它将读操作和写操作分离开来采用不同的策略以保证并发安全读操作直接访问底层数组完全无锁因此性能极高。写操作增、删、改不是直接修改原数组而是先复制一份当前数组的副本然后在副本上进行修改修改完成后再用新数组原子性地替换掉旧数组。这种“以空间换时间”的设计哲学使得它在读操作远多于写操作的场景下如白名单、配置管理、监听器列表性能表现远超传统的同步集合如Collections.synchronizedList。底层实现原理与数据结构CopyOnWriteArrayList的线程安全主要由两个核心组件保证一个volatile修饰的数组和一个用于写操作的锁。transient volatile Object[] array存储元素的数组用volatile修饰以保证可见性。final transient ReentrantLock lock用于写操作的同步锁JDK 1.5引入之后版本优化为内部锁对象。该数据存储结构本质为动态数组与 ArrayList 类似但其线程安全的实现机制却截然不同。public class CopyOnWriteArrayListE implements ListE, RandomAccess, Cloneable, java.io.Serializable { // 1. 用于保证写操作原子性的锁 final transient ReentrantLock lock new ReentrantLock(); // 2. 存储元素的数组volatile 保证修改后的新数组对所有线程立即可见 private transient volatile Object[] array; // 获取当前数组的辅助方法 final Object[] getArray() { return array; } // 设置新数组的辅助方法 final void setArray(Object[] a) { array a; } // ... 其他方法 }写操作 (以add(E e)为例)写操作通过加锁和数组复制来保证线程安全。加锁获取ReentrantLock锁确保同一时间只有一个线程能执行写操作。复制获取当前的旧数组并使用Arrays.copyOf方法创建一个长度加一的新数组。修改将新元素添加到新数组的末尾。替换调用setArray(newElements)方法将array引用指向这个新数组。由于array是volatile的这个赋值操作对所有线程立即可见。解锁释放锁允许其他写操作线程进入。public boolean add(E e) { final ReentrantLock lock this.lock; lock.lock(); // 1. 加锁 try { Object[] elements getArray(); // 2. 获取旧数组 int len elements.length; // 3. 复制新数组 Object[] newElements Arrays.copyOf(elements, len 1); newElements[len] e; // 4. 在新数组上修改 setArray(newElements); // 5. 原子性替换旧数组 return true; } finally { lock.unlock(); // 6. 解锁 } }读操作 (以get(int index)为例)读操作非常简单高效因为它不需要任何同步。访问直接通过getArray()获取当前的数组引用。返回返回指定索引位置的元素。public E get(int index) { return (E) getArray()[index]; // 无锁直接访问 }迭代器快照迭代器 (Snapshot Iterator)CopyOnWriteArrayList的迭代器是其设计的另一大亮点。创建快照当调用iterator()方法时迭代器会持有创建时刻的数组引用这个数组就是它的“快照”。弱一致性在迭代过程中即使有其他线程修改了原列表迭代器也只会遍历它持有的那份旧数组快照不会受到影响也绝不会抛出ConcurrentModificationException。不支持修改迭代器自身的remove()、add()等方法不被支持调用会抛出UnsupportedOperationException。优点与缺点特性优点缺点读性能极高。读操作无锁并发读取性能极佳。-写性能-很低。每次写操作都需要复制整个数组时间复杂度为 O(n)频繁写入时开销巨大。内存开销-很高。写操作期间内存中会同时存在新旧两个数组可能导致内存占用翻倍大数据量下有 OOM 风险。数据一致性迭代器安全遍历时不会因并发修改而崩溃。弱一致性。读操作可能获取到旧数据无法保证数据的实时性。适用场景读多写少的场景如监听器列表、配置项、黑白名单等。写多读少或读写频繁的场景完全不适用。典型应用场景监听器列表 (Listener List)在事件驱动模型中监听器的注册写和移除写频率很低但事件触发时遍历所有监听器读的频率非常高。系统配置/参数管理系统配置通常在启动时加载运行期间很少变更但会被大量业务线程频繁读取。黑白名单用于风控或权限控制的名单更新频率低但校验读取频率极高。源码中的优化点写操作的优化避免不必要的数组复制在执行set(int index, E element)这类修改操作时源码并非无脑地复制数组而是会先进行一次判断。核心逻辑只有当新值与旧值不相等时才会触发Arrays.copyOf来创建新数组副本。优化效果如果新值与旧值相同则跳过昂贵的数组复制过程直接复用原数组。这在一定程度上减少了写操作的内存开销和时间成本。public E set(int index, E element) { final ReentrantLock lock this.lock; lock.lock(); try { Object[] elements getArray(); E oldValue get(elements, index); // 1. 获取旧值 // 2. 核心优化仅当新旧值不同时才复制数组 if (oldValue ! element) { int len elements.length; Object[] newElements Arrays.copyOf(elements, len); newElements[index] element; setArray(newElements); } else { // 值未改变但仍需触发 volatile 写以保证可见性 setArray(elements); } return oldValue; } finally { lock.unlock(); } }可见性的优化保证 volatile 语义这是一个非常隐蔽但至关重要的优化点。在上面的set方法中即使新旧值相同、没有复制数组代码依然会执行setArray(elements)。核心逻辑setArray()方法的核心是为array字段赋值。由于array是volatile修饰的这个赋值操作本身就是一个 volatile 写。优化效果这确保了即使数据本身没有变化这次操作的“发生”对其他线程也是立即可见的。它防止了因指令重排序等原因导致的可见性问题保证了线程间状态感知的正确性。删除操作的优化高效的数组分段复制在执行remove(int index)操作时源码根据被删除元素的位置选择了最优的数组复制策略而不是简单粗暴地复制所有元素。删除末尾元素如果删除的是数组最后一个元素直接使用Arrays.copyOf(elements, len - 1)复制前len-1个元素即可。删除中间元素如果删除的是中间某个元素则会分两步进行复制以跳过被删除的元素使用System.arraycopy复制被删除元素之前的所有元素。使用System.arraycopy复制被删除元素之后的所有元素。这种分段复制的策略避免了不必要的元素移动提高了删除操作的效率。public E remove(int index) { final ReentrantLock lock this.lock; lock.lock(); try { Object[] elements getArray(); int len elements.length; E oldValue get(elements, index); int numMoved len - index - 1; Object[] newElements; if (numMoved 0) { // 1. 删除末尾元素直接复制前半部分 newElements Arrays.copyOf(elements, len - 1); } else { // 2. 删除中间元素分段复制跳过被删元素 newElements new Object[len - 1]; System.arraycopy(elements, 0, newElements, 0, index); System.arraycopy(elements, index 1, newElements, index, numMoved); } setArray(newElements); return oldValue; } finally { lock.unlock(); } }常见面试题CopyOnWriteArrayList是如何保证线程安全的答通过“写时复制”机制。写操作时先获取独占锁然后复制一份当前数组的副本在副本上进行修改最后用新数组原子性地替换旧数组。volatile关键字保证了新数组对所有线程的可见性。读操作则直接访问数组无需加锁。为什么CopyOnWriteArrayList的迭代器不会抛出ConcurrentModificationException答因为它的迭代器是“快照迭代器”。在创建迭代器时它会持有当时数组的一个引用快照。后续的写操作会创建新的数组但不会影响迭代器持有的旧数组快照。因此迭代器在遍历过程中感知不到集合结构的变化自然也就不会抛出异常。CopyOnWriteArrayList的适用场景和缺点是什么答适用场景非常适合读多写少的并发场景例如监听器列表、配置缓存、黑白名单等。缺点内存占用高每次写操作都会复制数组导致内存开销大有 OOM 风险。数据非实时读操作可能读到旧数据存在最终一致性问题。写性能差频繁写入时数组复制的开销巨大。CopyOnWriteArrayList和Collections.synchronizedList有什么区别答锁策略CopyOnWriteArrayList读写分离读无锁写加锁synchronizedList对所有操作读和写都加锁。性能在读多写少场景下CopyOnWriteArrayList的读性能远超synchronizedList在读写均衡或写多读少场景下synchronizedList更合适。迭代器CopyOnWriteArrayList的迭代器是弱一致性的快照迭代器不会抛异常synchronizedList的迭代器是快速失败的fail-fast并发修改时会抛出ConcurrentModificationException。和Vector、Collections.synchronizedList的区别是什么答这三者虽然都是线程安全的 List 实现但设计理念和适用场景截然不同。主要区别可以从以下三个维度来阐述1. 与 Vector 的对比核心区别在于“全同步”与“读写分离”Vector全同步机制它是 JDK 1.0 时代的产物属于“古老”的实现。它的线程安全是通过在几乎所有方法包括get、add等上都加上synchronized关键字来实现的。这意味着 Vector 是全同步的无论是读操作还是写操作都必须竞争同一把锁。CopyOnWriteArrayList读写分离它采用了“读写分离”的思想。读操作完全无锁直接访问底层数组写操作才需要加锁并进行数组复制。结论在高并发场景下Vector 的“全同步”会导致严重的性能瓶颈因为读操作也会阻塞其他线程。而 CopyOnWriteArrayList 允许并发读取性能远高于 Vector。因此Vector 在现代开发中已被视为过时不推荐使用。2. 与 Collections.synchronizedList 的对比核心区别在于“锁粒度”与“性能”Collections.synchronizedList粗粒度锁它通过装饰器模式包装了一个普通的 ArrayList并使用一个共有的mutex对象锁。它的锁粒度非常粗所有的读、写操作都必须串行执行读写互斥读读也互斥。在高并发读取的场景下这种粗粒度的锁会引发激烈的锁竞争导致 CPU 资源浪费在上下文切换上。CopyOnWriteArrayList极致优化读性能它通过“写时复制”规避了锁竞争。读操作不需要获取任何锁多个线程可以同时无阻塞地读取列表。结论在读多写少的场景下如白名单、配置管理CopyOnWriteArrayList 的读性能远超 synchronizedList而在读写均衡或写操作频繁的场景下synchronizedList 因为不需要频繁复制数组反而更合适。3. 迭代器行为的区别CopyOnWriteArrayList采用弱一致性的快照迭代器。迭代器持有创建时刻的数组快照遍历时不会抛出ConcurrentModificationException但也无法感知到迭代开始后的修改。Vector 和 synchronizedList它们的迭代器都是快速失败fail-fast的。如果在遍历过程中有其他线程修改了集合迭代器会立即抛出ConcurrentModificationException。对比维度CopyOnWriteArrayListCollections.synchronizedListVector核心机制读写分离 (写时复制)全锁机制 (装饰器模式)全同步 (方法级同步)读性能极高 (无锁并发读)一般 (需竞争锁)差 (需竞争锁)写性能差 (需复制数组开销大)一般 (需竞争锁)差 (需竞争锁)锁粒度写操作独占锁读操作无锁粗粒度 (全操作互斥)粗粒度 (全操作互斥)迭代器快照迭代器 (不抛异常)快速失败 (抛异常)快速失败 (抛异常)适用场景读多写少 (如监听器列表)读写均衡 / 写多已过时 (不推荐)

更多文章