同步容器类
同步容器类包括Vector和Hashtable(二者是早期JDK的一部分),还包括JDK1.2中添加的一些相似的类。同步容器类实现线程安全的方式是:将状态封闭起来,并对每个公有方法进行同步,使得每次只有一个线程能访问容器状态。这里解释一下所谓“状态”指的就是成员变量,“封装起来”即将它们设不private,但是通过公有的方法外界仍然可以访问修改类的私有成员,所以要用synchronized将公有方法进行同步,使得每次只有一个线程能访问容器状态。在多线程环境下调用同步容器类自带的所有方法时,实际上都是在串行执行,所以这严重降低并发性和吞吐量。
像List、Set、Map这些原本不是同步容器类,也可以通过Collections.synchronizedXXX工厂方法将其变为同步容器类,即对其公有方法进行同步。
[java]
- List<Student> students=Collections.synchronizedList(new ArrayList<Student>());
同步容器类的问题
容器上常见的操作包括:迭代访问、跳转(根据指定顺序找到当前元素的下一个元素)、条件运算(先检查再操作Check-And-Act,比如若没有则添加)。
[java]
- public static Object getLast(Vector vec){
- int lastIndex=vec.size()-1;
- return vec.get(lastIndex);
- }
- public static Object deleteLast(Vector vec){
- int lastIndex=vec.size()-1;
- return vec.remove(lastIndex);
- }
[java]
- public static Object getLast(Vector vec){
- synchronized(vec){
- int lastIndex=vec.size()-1;
- return vec.get(lastIndex);
- }
- }
- public static Object deleteLast(Vector vec){
- synchronized(vec){
- int lastIndex=vec.size()-1;
- return vec.remove(lastIndex);
- }
- }
[java]
- for(int i=0;i<vec.size();i++)
- doSomething(vec.get(i));
正确的做法是在迭代之前对vector加锁:
[java]
- synchronized(vec){
- for(int i=0;i<vec.size();i++)
- doSomething(vec.get(i));
- }
迭代器与ConcurrentModificationException
使用for或for-each循环对容器进行迭代时,javac内部都会转换成使用Iterator。在对同步容器类进行迭代时如果发现元素个数发生变化,那么hasNext和next将抛出ConcurrentModificationException,这被称为及时失效(fail-fast)。
[java]
- List<Student> students=Collections.synchronizedList(new ArrayList<Student>());
- //可能抛出ConcurrentModificationException
- for(Student student:students)
- doSomething(student);
隐藏的迭代器
注意,下面的情况会间接地进行迭代操作,也会抛出ConcurrentModificationException:
- 容器的toString()、hashCode()和equals()方法
- containsAll()、removeAll()、retainAll()等方法
- 调用以上方法的方法,比如StringBuildre.append(Object)会调用toString()
- 容器作为另一个容器的元素或者键
- 把容器作为参数的构造函数
扯句不相关的话,编译器会把字符串的连接操作转换为调用StringBuildre.append(Object)。《Effective Java》也提出当使用多个"+"进行字符串连接时考虑使用StringBuildre.append()代替,因为每次“+”操作都要完全地拷贝2个字符串,而StringBuilder.append()是在第一个字符串后面连接第2个字符串,跟C++中的Vector是一个原理。
并发容器
同步容器将对状态的访问都串行化,以实现他们的线程安全性。这样做的代价是严重降低了并发性和吞吐量。
并发容器类提供的迭代器不会抛出ConcurrentModificationException,因此不需要在迭代时对容器进行加锁。
下面介绍Java5.0中新增加的几个并发容器类。
并发Map
同步容器类在执行每个操作期间都加了一个锁,在一些操作中例如HashMap.get()可能包含大量的工作,如何hashCode不能均匀地分布散列值,那就需要在很多元素上调用equals,而equals本身就有一定的计算量。 HashMap将每个方法都在同一个锁上同步使得每次只能有一个线程访问容器,ConcurrentHashMap与HashMap不同,它采用了粒度更细的分段锁(Lock Striping)。 结果是任意的读线程可以并发地访问Map,读线程和写线程可以并发地访问Map,一定数量的写线程可以并发地访问Map。而且在单线程的环境下,ConcurrentHashMap比HashMap性能损失很小。
对于需要在整个Map进行的计算,例如size和isEmpty,ConcurrentHashMap会返回一个近似值而非精确值,因为size()返回的值在计算时可能已经过期了。
ConcurrentHashMap接口中增加了对一些常见复合操作的支持,例如“若没有则添加”、“若相等则替换”、“若相等则移除”等等,在ConcurrentMap接口中已经声明为原子操作。
Copy-On-Write容器
CopyOnWriteArrayList用于替代同步List,同理CopyOnWriteAeeaySet用于替代同步Set,这里就以 CopyOnWriteArrayList为例。 “写时复制(Copy-On-Write)”容器的线程安全性在于:只要发布一个事实不可变的对象,那么在访问对象时就不需要再进一步同步。当需要修改对象的时候都会重新复制发布一个新的容器副本。
如果一个对象在被创建之后其状态就不能被修改,那这个对象就是不可变对象。不可变对象一定是线程安全的。但要注意即使将所有域声明为final,这个对象仍然有可能是可变的,因为final域中可以保存可变对象的引用。下面举个例子,在可变对象上构建不可变类:
[java]
- public final class ThreeStorage{
- private final Set<String> storages=new HashSet<String>();
- public ThreeStorage(){
- storages.add("One");
- storages.add("Two");
- storages.add("Three");
- }
- public boolean isStorage(String name){
- return storages.contains(name);
- }
- }
每当需要修改容器时都是复制底层数组,看一下set()函数的的源代码:
[java]
- public class CopyOnWriteArrayList<E>{
- private volatile transient Object[] array;
- final Object[] getArray() {
- return array;
- }
- final void setArray(Object[] a) {
- array = a;
- }
- public E set(int index, E element) {
- //获取重入锁
- final ReentrantLock lock = this.lock;
- lock.lock();
- try {
- Object[] elements = getArray();
- Object oldValue = elements[index];
- //使用的是==而非equals
- if (oldValue != element) {
- int len = elements.length;
- //复制底层数组
- Object[] newElements = Arrays.copyOf(elements, len);
- newElements[index] = element;
- //把底层数组写回
- setArray(newElements);
- } else {
- setArray(elements);
- }
- return (E)oldValue;
- } finally {
- //释放锁
- lock.unlock();
- }
- }
- }
一进入set()函数就加了锁,函数结束时才释放锁。
因为复制底层数组本身就有一定的开销,所以仅当迭代操作远远多于修改操作时,才应该使用CopyOnWrite容器。
并发Queue
基本的Collection就是List、Set和Map,Queue底层是由LinkedList来实现的,因为它去除了List的随机访问功能,因此更高效。
ConcurrentinkedQueue是一个传统的先进先出队列。PriorityQueue是一个非并发的优先队列(说这个似乎与本文的主题无关)。
Queue上的操作是阻塞的,如果队列为空,那么获取元素的操作会立即返回空值。BlockingQueue的插入和获取操作是阻塞式的,如果队列为空,那么获取操作将一直阻塞队列中有一个可用的元素;如果队列已满,那么插入操作将一直阻塞。
Sorted容器
ConcurrentSkipListMap用于替代SortedMap,ConcurrentSkipListSet用于替代SortedSet。TreeMap和TreeSet分别实现了SortedMap和SortedSet。By the way,既然是"sorted",那么这类容器的元素就必须实现Comparable接口。