文章目录

  • 第二章 Java并行程序基础
  • 2.1有关线程你必须知道的事
  • 2.2初始线程:线程的基本操作
  • 2.2.1新建线程
  • 2.2.2终止线程
  • 2.2.3线程中断
  • 2.2.4等待(wait)和通知(notify)
  • 2.2.5 挂起(suspend)和继续执行(resume)线程
  • 2.2.6等待线程结束(join)和谦让(yield)
  • 2.3 volatile与Java内存模型(JMM)
  • 2.4 分门别类的管理:线程组
  • 2.5 驻守后台:守护线程(Daemon)
  • 2.6 先干重要的事:线程优先级priority
  • 2.7 线程安全的概念与synchronized
  • 2.8 程序中的幽灵:隐蔽的错误
  • 2.8.1 无提示的错误案例
  • 2.8.2 并发下的ArrayList
  • 2.8.3 并发下诡异的HashMap
  • 2.8.4 初学者常见问题:错误的加锁


本文摘自《实战Java高并发程序设计》,了解详细内容推荐购买原版书籍。

第二章 Java并行程序基础

2.1有关线程你必须知道的事

进程:计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础。是线程的容器,程序的实体。

线程:轻量级进程,是程序执行的最小单位。

使用多线程而不是多进程进行并发程序设计,因为线程之间切换和调度成本远小于进程。

java串行和并行流程编排 java并行程序设计_多线程


NEW状态表示刚创建的线程,还未执行。Start()方法调用,才表示线程开始执行。执行时线程处于Runnable状态,表示线程所需资源已经备好。如果在执行的过程中遇到了synchronized同步块,则进入Blocked阻塞状态,线程暂停执行,直到获得请求的锁。Waiting和Timed_Waiting都表示等待状态,区别是Waiting会进入无时间限制的等待,TW有时限。一般,Waiting线程是在等待一些特殊事件。一旦等到,线程再次执行,进入Runnable状态。当线程执行完毕后,则进入Terminated状态,表示结束。

2.2初始线程:线程的基本操作

2.2.1新建线程
Thread t1 = new Thread();
t1.start();

start()方法新建线程并让这个线程执行run()方法。

Thread t1 = new Thread();
t1.run();

在当前线程中调用run()方法。
注意:不要用run()来开启新线程,他只会在当前线程中,串行执行run()中的代码。

Tread t1 =new Thead(){
	@Override
	public void run(){
		System.out.println("HEllo, i am t1");
	}
};
t1.start();

匿名内部类,重载run()方法。
考虑到Java是单继承的,继承本身也是一种很宝贵的资源,所以可以使用runnable接口实现同样操作。Runnable是一个单方法接口,只有一个run()方法。
单继承的意思是,一个子类不能有两个以上的父类。如果你想写一个类C,但这个类C已经继承了一个类A,此时,你又想让C实现多线程。用继承Thread类的方式不行了。(因为单继承的局限性)。此时,只能用Runnable接口。

public interface Runnable {
	public abstract void run();
}

此外,Thread类还有一个重要的构造方法:

public Thread(Runnable target)
public void run(){
	if (target!=null){
	target.run();
	}		
}

传入一个Runnable接口的实例,在start()方法调用时,新的线程就会执行Runnable.run()方法。
注意:默认的Thread.run()就是直接调用内部的Runnable接口。因此,使用Runnable接口告诉线程该干什么,更为合理。

public class CreateThread3 implements Runnable {
    public static void main(String[] args) {
        Thread t1 = new Thread(new CreateThread3());
        t1.start();
    }
    @Override
    public void run() {
        System.out.println("oh,i am Runnable!");   
    }
}

上述代码实现runnable接口,并将该实例传入Thread。避免了重载Thread.run(),单纯使用接口定义Thread,是最常用的方法。

2.2.2终止线程

Thread有一个stop()方法,但是太过暴力,强行把执行到一半的线程终止,释放线程所持有的锁,可能会引起一些数据不一致的问题。

java串行和并行流程编排 java并行程序设计_多线程_02


可以增加一个stopMe()方法,增加stopme标记。这样就没机会写坏对象了。

public static class ChangeObjectThread extends Thread {
    volatile boolean stopme = false;

    public void stopMe(){
        stopme = true;
    }
    @Override
    public void run(){
        while(true){
            if (stopme) {
                System.out.println("exit by stopme");
                break;
            }
            synchronized (u) {
                int v = (int) (System.currentTimeMillis() / 1000);
                u.setId(v);
                //Oh,do sth .else
                try {
                    Thread.sleep(100);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
                u.setName(String.valueOf(v));
            }
            Thread.yield();
        }
    }
}
2.2.3线程中断

中断表面上就是让目标线程停止执行的意思,实际上并非如此。
线程中断不会使线程立即退出,而是给线程发送一个退出通知。至于目标线程收到后如何处理,则由目标线程自行决定。
与线程中断有关的三个方法:

public void Thread.interrupt()
public boolean Thread.isInterrupt()
public static boolean Thread.interrupted()

Thread.interrupt()方法是一个实例方法。通知目标线程中断,也就是设置中断标志位表示当前线程已经被中断了。Thread.isInterrupt()方法也是实例方法,判断当前线程有没有被中断(通过检查中断标志位)。静态方法Thread.interrupted()判断当前线程中断状态,同时清除中断标志位状态。
如果希望程序在中断后退出,就必须为它增加相应中断处理代码:

public static void main(String[] args) throws InterruptedException {
        Thread t1 = new Thread(){
            @Override
            public void run(){
                while (true) {
                    if (Thread.currentThread().isInterrupted()){
                        System.out.println("Interrupted!");
                        break;
                    }
                    Thread.yield();
                }
            }
        };
        t1.start();
        Thread.sleep(2000);
        t1.interrupt();
    }

Thread.sleep()函数签名如下:
Public static native void sleep(long millis) throws InterruptedExpection
“A native method is a Java method whose implementation is provided by non-java code.”
Thread.sleep()方法会让当前线程休眠,会抛出一个InterruptedExpection中断异常。InterruptedExpection不是运行时异常,也就是说程序必须捕获并处理它,当线程在sleep休眠时被中断,这个异常就会产生。

public static void main(String[] args) throws InterruptedException {
        Thread t1 = new Thread(){
            @Override
            public void run(){
                while (true) {
                    if (Thread.currentThread().isInterrupted()){
                        System.out.println("Interrupted!");
                        break;
                    }
                    try {
                        Thread.sleep(2000);
                    } catch (InterruptedException e) {
                        System.out.println("Interrupted When Sleepp");
                        //设置中断状态
                        Thread.currentThread().interrupt();
                    }
                    Thread.yield();
                }
            }
        };
        t1.start();
        Thread.sleep(2000);
        t1.interrupt();
    }

注意:Thread.sleep()方法由于中断抛出异常,此时,它会清除中断标记,如果不加处理,在下一次循环开始时,就无法捕获这个中断,所以在异常处理中,再次设置中断标记位。

2.2.4等待(wait)和通知(notify)

× 为了支持多线程之间协作,JDK提供了接口线程等待wait()方法和通知notify()方法。这两个方法不在Thread类中,而在输出Object类。所以任何对象都可以调用。

  两个方法签名如下:

  Public final void wait() throws InterruptedExpection
  Public final native void notify()

  线程A调用了obj.wait()方法后,就会停止继续执行,转为等待状态。一直等到其他线程调用了obj.notify()方法为止。Obj对象就变成了多个线程中有效通信手段。

java串行和并行流程编排 java并行程序设计_守护线程_03


Object.notify()被调用时,会从等待队列中随机选择一个线程唤醒。

Obj.notifyAll()方法可以唤醒所有等待线程。

Object.wait()必须包含在对应的synchroniz的语句中,无论是wait()或notify()都需要获得目标Object的一个监视器(锁)。

java串行和并行流程编排 java并行程序设计_守护线程_04


注意:sleep()和wait()方法都可以让线程等待若干时间。除了wait()可以被唤醒外,另个区别就是wait()方法会释放目标对象的锁,而sleep()不会释放任何资源。

2.2.5 挂起(suspend)和继续执行(resume)线程

× 被标记为废弃方法,不推荐使用。原因是suspend()挂起线程时,不会释放任何锁资源。如果resume()操作意外的在suspend()之前就执行了,那么被挂起的线程可能很难有机会被继续执行。更严重的是:它占用的锁不会释放,可能导致整个系统工作不正常。

  被挂起的线程从状态上看,还是runnable,会影响对系统当前状态判断。

java串行和并行流程编排 java并行程序设计_并发_05


  Jstack是java虚拟机自带的一种堆栈跟踪工具。jstack用于打印出给定的java进程ID或core file或远程调试服务的Java堆栈信息,生成java虚拟机当前时刻的线程快照。

  可以利用wait()和notify()方法在应用层面上实现suspend()和resume()功能。

  给出一个标记变量suspendme,表示当前线程是否被挂起。增加suspendMe()和resumeMe()两个方法,用于挂起和继续执行线程。

java串行和并行流程编排 java并行程序设计_守护线程_06

2.2.6等待线程结束(join)和谦让(yield)

很多时候,一个线程的输入可能非常依赖于另一个或多个线程的输出,这就需要等待依赖线程执行完毕。JDK提供join()操作实现。

两个join()方法:

Public final void join() throws InterruptedExpection

Public final synchronized void join(long millis) throws InterruptedExpection

第一个表示无限等待,一直阻塞当前线程,直到目标线程执行完毕。

第二个给出最大等待时间,超过时间目标线程还在执行,当前线程“等不及”继续执行。

java串行和并行流程编排 java并行程序设计_守护线程_07


  Join()的本质是让调用线程wait()在当前线程对象实例上。当线程执行完成后,被等待线程会在退出前调用notifyAll()通知所有等待线程继续执行。因此,值得注意的是:不要在应用程序中,在Thread对象实例上使用类似wait()或notify()等方法,这很可能影响系统API的工作,或被系统API影响。

  Thread.yield()方法:

  Public static native void yield();

  这是一个静态方法,一旦执行,它会使当前线程让出CPU,之后再进行CPU资源争夺。如果觉得一个线程不太重要,或者优先级非常低,又害怕它占用太多CPU资源,可以适当调用Thread.yield()方法。

2.3 volatile与Java内存模型(JMM)

* Java内存模型都是围绕原子性、有序性、可见性展开的。为了在特殊场合,确保线程之间的原子性、有序性、可见性。Java使用一些特殊操作或关键字来声明、告诉虚拟机,在这个地方要尤其注意,不能随便变动优化目标指令。关键字Volatile就是其中之一

  保证写入数据不坏,最简单就是加入volatile声明,告诉编译器(虚拟机)这个数据要格外小心,因为他会不断被修改。

java串行和并行流程编排 java并行程序设计_并发_08


  需要注意的是,volatile不能代替锁。也无法保证一些复合操作的原子性。

  此外,volatile也能保证数据的可见性和有序性。例子:

java串行和并行流程编排 java并行程序设计_守护线程_09


java串行和并行流程编排 java并行程序设计_并发_10


  在虚拟机client模式下,由于JIT没有做足够的优化,在主线程修改ready变量的状态后,ReaderThread可以发现这个改动,并退出程序。但在Server模式下,由于系统优化的结果,ReaderThread线程无法“看到”主线程中的修改,导致ReaderThread永远无法退出。这就是典型的可见性的问题。

  注意:可以使用Java虚拟机参数-server切换到server模式。

  可以用volatile来申明ready变量,告诉虚拟机这个变量可能在不同线程修改。

2.4 分门别类的管理:线程组

在一个系统中,如果线程数量比较多,而且功能分配比较明确,就可以将相同功能的线程放置在一个线程组中。

  线程组的使用:

java串行和并行流程编排 java并行程序设计_java串行和并行流程编排_11


  其中activeCount()方法可以获得线程的总数,由于线程时动态的,这个值只是一个估计。.list()方法可以打印这个线程组的所有线程信息,对调试有帮助。

  线程组有stop()方法,停止线程组中所有线程。使用时谨慎。

2.5 驻守后台:守护线程(Daemon)

守护线程在后台默默完成一些系统性的服务,比如,垃圾回收线程、JIT线程就可以理解为守护线程。与之对应的是用户线程,可以认为是系统的工作线程,他会完成这个程序应该要完成的业务操作。如果用户线程全部结束,就意味着这个程序实际无事可做了。守护线程也没有存在必要了,那么程序就应该自然结束。因此,在Java应用内,只有守护线程时,虚拟机会自然退出。

  守护线程使用:

java串行和并行流程编排 java并行程序设计_并发_12


  注意:守护线程必须在线程start()之前设置,否则失败报错,但继续执行,被当为用户线程。

java串行和并行流程编排 java并行程序设计_并发_13


  例子中t为守护线程,系统中只有主线程main为用户线程,因此,在main线程休眠2秒后退出时,整个程序也随之结束(只有守护线程)。如果不设置守护线程,t线程会一直打印。

2.6 先干重要的事:线程优先级priority

运气不好高优先级线程也可能抢占失败。Java中使用1-10(有效范围)表示线程优先级。高优先级的线程倾向于更快的完成。

  一般可以使用内置三个静态标量表示:

java串行和并行流程编排 java并行程序设计_Java_14


java串行和并行流程编排 java并行程序设计_守护线程_15


java串行和并行流程编排 java并行程序设计_多线程_16

2.7 线程安全的概念与synchronized

volatile并不能真的保证线程安全。它只能确保一个线程修改数据后,其他线程能够看到这个改动。但当两个线程同时修改某一数据时,依然会产生冲突。

java串行和并行流程编排 java并行程序设计_守护线程_17


  期望最终结果为20000000,但最终值会小于20000000,。因为两个线程同时对i进行写入时,其中一个线程结果会覆盖另一个。(虽然i被声明为volatile变量)

java串行和并行流程编排 java并行程序设计_java串行和并行流程编排_18


  要解决这个问题,要保证多个线程对i操作时完全同步。==在A线程写入时,B不仅不能写,同时也不能读。

  关键字synchronized作用是实现线程间同步。它的工作是对同步的代码加锁,使得每一次只有一个线程能够进入同步块,从而保证线程的安全性。

  synchronized用法

  • 指定加锁对象:对给定对象加锁,进入同步代码前要获得给定对象的锁。
  • 直接作用于实例方法:相当于对当前实例加锁,进入同步代码前要获得当前实例的锁。
  • 直接作用于静态方法:相当于对当前类加锁,进入同步代码前要获得当前类的锁。

    上述代码也可以写成如下形式:(作用于实例方法)

      在进入increase()方法前,线程必须获得当前对象实例的锁。本例中就是instance对象。注意14、15行Thread创建方式。使用Runnable接口创建两个线程,两个线程都指向同一个Runnable接口实例(instance对象),这样保证两个线程工作时,关注同一个对象锁,保证线程安全。
      一种错误的同步方式:


      两个线程指向了不同的Runnable实例。修改方式:将synchronized作用于静态方法。方法块要请求当前类的锁而非当前实例。

2.8 程序中的幽灵:隐蔽的错误

2.8.1 无提示的错误案例
2.8.2 并发下的ArrayList

ArrayList线程不安全容器。

java串行和并行流程编排 java并行程序设计_守护线程_19


上述程序执行可能三种结果:

一, 正常结束。

二, 程序抛出异常。

java串行和并行流程编排 java并行程序设计_Java_20


java串行和并行流程编排 java并行程序设计_多线程_21


  ArrayList在扩容过程中,内部一致性被破坏,由于没有锁的保护,另一个线程访问到不一致的内部状态,导致出现越界。

  三、出现一个隐蔽的错误,比如打印ArrayList大小。

1793758

* 多线程访问冲突,保存容器大小变量被多线程不正常访问,同时两个线程同时对一个位置赋值。
  注意:改进方法:用线程安全的Vector替换ArrayList即可。

2.8.3 并发下诡异的HashMap

HashMap非线程安全。

java串行和并行流程编排 java并行程序设计_多线程_22


java串行和并行流程编排 java并行程序设计_多线程_23


上述代码期望得到map.size()=100000.实际上会有三种可能:

一、 程序正常结束,结果符合预期。

二、 程序正常结束,结果不对,小于100000.

三、 程序永远无法结束。

  前两种情况和ArrayList类似,第三种情况时,打开任务管理器,会发现这段代码占用了极高的CPU,最有可能占用了两个CPU核,并使得这两个CPU占用率100%。这非常类似于死循环的情况。

  使用jstack工具显示程序的线程信息。其中jps可以显示当前系统中所有的Java进程。而jstack可以打印给定Java进程的内部线程及其堆栈。

java串行和并行流程编排 java并行程序设计_守护线程_24


可以找到t1,t2和main线程:

java串行和并行流程编排 java并行程序设计_守护线程_25


java串行和并行流程编排 java并行程序设计_并发_26


  可以看到,主线程main处于等待状态,并且这个等待是由于join()方法引起的,符合预期。而t1和t2线程都处于Runnable状态,并且执行当前语句为HashMap.put()方法。查看put()方法的第498行代码,如下:

java串行和并行流程编排 java并行程序设计_java串行和并行流程编排_27


  可以看到,当前两个线程正在遍历HashMap内部数据。当前所处循环乍看是一个迭代遍历,就如同遍历一个链表一样。但是,由于多线程冲突,这个链表结构已经找到破坏,链表成环了!图2.9所示最简单一种环状结构。

java串行和并行流程编排 java并行程序设计_java串行和并行流程编排_28


  此死循环问题在JDK8中已经不存在了。Java8对HashMap内部实现做了大规模调整,规避了这个问题。但是,贸然在多线程环境下使用HashMap依然会导致内部数据不一致。

  解决方法:使用ConcurrentHashMap。

2.8.4 初学者常见问题:错误的加锁

假设我么需要一个计数器,计数器会被多个线程同时访问:

java串行和并行流程编排 java并行程序设计_多线程_29


java串行和并行流程编排 java并行程序设计_多线程_30


  Integer数据不可变对象。也就是说对象一旦被创建就不能被修改。

  使用javap反编译这段代码的run()方法,可以看到:

java串行和并行流程编排 java并行程序设计_并发_31


  19-22行实际上使用了Integer.valueOf()方法新建了一个Integer对象,并赋值给i。i++实际为i=Integer.valueOf(i.intValue()+1);查看Integer.valueOf(),可以看到:

java串行和并行流程编排 java并行程序设计_Java_32


  Integer.valueOf()实际是工厂方法,倾向返回一个代表指定数值的Integer实例。在多线程之间,不一定能看到同一个对象(i对象一直在变)。加锁可能加在不同对象实例上。

  修正方法:将synchronized(i)给为synchronized(instance)即可