博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
漫画:聊聊线程池中,线程的增长/回收策略
阅读量:2456 次
发布时间:2019-05-10

本文共 4426 字,大约阅读时间需要 14 分钟。

一、序

public static ExecutorService newThreadPool() {
return new ThreadPoolExecutor( 30, 60, 60L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue
());}

我们今天就来借这个问题,聊聊线程池中维护的线程,它增长和回收的策略是什么样的?

二、线程池的策略

2.1 线程池的各项参数

当我们聊到线程池中线程的增长策略的时候,最抓眼球的就是它的核心线程数(corePoolSize)和最大线程数(maximumPoolSize),但是仅看这两个参数是不够全面的,线程数量的增长,还与任务等待队列有关系。

我们先来看看 ThreadPoolExecutor 最全参数的构造方法:

public ThreadPoolExecutor(  int corePoolSize,  int maximumPoolSize,  long keepAliveTime,  TimeUnit unit,  BlockingQueue
workQueue, ThreadFactory threadFactory, RejectedExecutionHandler handler) {
// ...}

简单解释一下各个参数是什么意思:

  • corePoolSize:核心线程数;
  • maximumPoolSize:线程池的最大线程数;
  • keepAliveTime:核心线程数之外的线程,最大空闲存活的时长;
  • unit:keepAliveTime 的时间单位;
  • workQueue:线程池的任务等待队列;
  • threadFractory:线程工厂,用来为线程池创建线程;
  • handler:拒绝策略,当线程池无法处理任务时的拒绝方式;

这其中很多参数的配置,都是相互影响的。例如任务等待队列 workQueue 配置不当,可能导致线程池中的线程,永远无法增长到核心线程数(maximumPoolSize)配置的线程数。

2.2 线程池中线程的增长策略

看到这里你应该就清楚了,线程池线程的增长策略,和 3 个参数有关系:

  • corePoolSize:核心线程数
  • maximumPoolSize:最大线程数;
  • workQueue:等待任务队列;

它们之前的关系是这样的:

接下来我们看看理想情况下,线程池中线程的增长策略。

默认情况下,初始时线程池是空的,当有新任务来了时,线程池开始通过线程工厂(threadFractory)创建线程来处理任务。

新的任务会不断的触发线程池中线程的创建,直到线程数量达到核心线程数(corePoolSize),接下来会停止线程的创建,而是将这个新任务放入任务等待队列(workQueue)。

新任务不断进入任务等待队列,当该队列满了时,开始重新创建线程处理任务,直到线程池中线程的数量,到达 maximumPoolSize 配置的数量。

到这一步时,线程池的线程数达到最大值,并且没有空闲的线程,任务队列也存满了任务,这时如果还有新的任务进来,就会触发线程池的拒绝策略(handler),如果没有配置拒绝策略就会抛出 RejectedExecutionException 异常。

到这里线程的增长策略就说清楚了,我们可以通过下图来了解完整的流程。

其中比较关键的就是任务的等待队列,无论等待队列的实现结构是什么样的,只有在它满的时候,线程池中的线程才会向最大线程数增长。但是一个能够满的队列,它的前提是必须是一个有界队列

这就是文章开头举的例子暗藏的坑,我们回顾一下前面构造的线程池。

public static ExecutorService newThreadPool() {  return new ThreadPoolExecutor(    30, 60,    60L, TimeUnit.MILLISECONDS,    new LinkedBlockingQueue
());}

可以看到,这里虽然最大线程数是大于核心线程数的,但是它的等待队列配置的是一个 LinkedBlockingQueue,从名字上可以看出这是一个基于链表实现的阻塞队列,而用它的默认构造方法构造时,其容量设定为 Integer.MAX_VALUE,可以简单理解它是一个无界队列。

public LinkedBlockingQueue() {  this(Integer.MAX_VALUE);}public LinkedBlockingQueue(int capacity) {  if (capacity <= 0) throw new IllegalArgumentException();  this.capacity = capacity;  last = head = new Node
(null);}

这也就是为什么说,这样构造的线程池,核心线程数的配置参数,永远都用不到,因为它的等待队列永远没有满的时候。

2.3 线程池中线程的收缩策略

线程池中执行的任务,总有执行结束的时候。那么线程池当线程池中存在大量空闲线程时,也会有一定的收缩策略,来回收线程池中多余的线程。

线程池中线程的收缩策略,和以下几个参数相关:

  • corePoolSize:核心线程数;
  • maximumPoolSize:线程池的最大线程数;
  • keepAliveTime:核心线程数之外的线程,空闲存活的时长;
  • unit:keepAliveTime 的时间单位;

corePoolSize 和 maximumPoolSize 我们比较熟悉了,另外能够控制它的就是 keepAliveTime 空闲存活时长,以及这个时长的单位。

当线程池中的线程数,超过核心线程数时。此时如果任务量下降,肯定会出现有一些线程处于无任务执行的空闲状态。那么如果这个线程的空闲时间超过了 keepAliveTime&unit 配置的时长后,就会被回收。

需要注意的是,对于线程池来说,它只负责管理线程,对于创建的线程是不区分所谓的「核心线程」和「非核心线程」的,它只对线程池中的线程总数进行管理,当回收的线程数达到 corePoolSize 时,回收的过程就会停止。

对于线程池的核心线程数中的线程,也有回收的办法,可以通过 allowCoreThreadTimeOut(true) 方法设置,在核心线程空闲的时候,一旦超过 keepAliveTime&unit 配置的时间,也将其回收掉。

public void allowCoreThreadTimeOut(boolean value) {  if (value && keepAliveTime <= 0)    throw new IllegalArgumentException("Core threads must have nonzero keep alive times");  if (value != allowCoreThreadTimeOut) {    allowCoreThreadTimeOut = value;    if (value)      interruptIdleWorkers();  }}

allowCoreThreadTimeOut() 能被设置的前提是 keepAliveTime 不能为 0。

2.3 查缺补漏

1. 等待队列还会影响拒绝策略

等待队列如果配置成了无界队列,不光影响线程数量从核心线程数向最大线程数的增长,还会导致配置的拒绝策略永远得不到执行。

因为只有在线程池中的工作线程数量已经达到核心线程数,并且此时等待队列也满了的情况下,拒绝策略才能生效。

2. 核心线程数可以被「预热」

前面提到默认的情况下,线程池中的线程是根据任务来增长的。但如果有需要,我们也可以提前准备好线程池的核心线程,来应对突然的高并发任务,例如在抢购系统中就经常有这样的需要。

此时就可以利用 prestartCoreThread() 或者 prestartAllCoreThreads() 来提前创建核心线程,这种方式被我们称为「预热」。

3.  对于需要无界队列的场景,怎么办?

需求是多变的,我们肯定会碰到需要使用无界队列的场景,那么这种场景下配置的 maximumPoolSize 就是无效的。

此时就可以参考 Executors 中 newFixedThreadPool() 创建线程池的过程,将 corePoolSize 和 maximumPoolSize 保持一致即可。

public static ExecutorService newFixedThreadPool(int nThreads) {  return new ThreadPoolExecutor(    nThreads, nThreads,    0L, TimeUnit.MILLISECONDS,    new LinkedBlockingQueue
());}

此时核心线程数就是最大线程数,只有增长到这个数量才会将任务放入等待队列,来保证我们配置的线程数量都得到了使用。

4. 线程池是公平的吗?

所谓的公平,就是先到的任务会被先执行。这在线程池中,显然是不公平的。

不提线程池中线程执行任务是通过系统去调度的,这一点就决定了任务的执行顺序是无法保证的,这就是是非公平的。另外只从线程池本身的角度来看,我们只看提交的任务顺序来看,它也是非公平的。

首先前面到的任务,如果线程池的核心线程已经分配出去了,此时这个任务就会进入任务队列,那么如果任务队列满了之后,新到的任务会直接由线程池新创建线程去处理,直到线程数达到最大线程数。

那么此时,任务队列中的任务,虽然先添加进线程池等待处理,但是这些任务的处理时机,是晚于后续新创建线程去处理的任务的,所以说仅从任务的角度,依然是非公平的。

三、小结时刻

本文我们聊到了线程池中,对于线程数量的增长和收缩策略。

在这里我们简单总结一下:

1. 增长策略。默认情况下,线程池是根据任务先创建足够核心线程数的线程去执行任务,当核心线程满了时将任务放入等待队列。待队列满了的时候,继续创建新线程执行任务直到到达最大线程数停止。再有新任务的话,那就只能执行拒绝策略或是抛出异常。

2. 收缩策略。当线程池线程数量大于核心线程数 && 当前有空闲线程 && 空闲线程的空闲时间大于 keepAliveTime 时,会对该空闲线程进行回收,直到线程数量等于核心线程数为止。

总之要谨记,慎用无界队列。

转载地址:http://yochb.baihongyu.com/

你可能感兴趣的文章
python super_使用Python super()增强您的课程
查看>>
愚人节导入_愚人节Python恶作剧
查看>>
正则表达式科学计数法_数据科学家的正则表达式
查看>>
sql基础_SQL基础
查看>>
一个工作表可以有两个事件吗_你有两个工作
查看>>
Raul的新机器学习书!
查看>>
python制作可视化图表_可视化数据–用python覆盖图表
查看>>
双耳节拍 枕头_枕头3-0-0不在
查看>>
谷歌聊天机器人api_如何编写针对Google地图等网络应用量身定制的聊天机器人
查看>>
npm和angular_如何开发,使用和发布Angular库到NPM
查看>>
为什么要远离对日外包_远离魔法-或:为什么我不想再使用Laravel
查看>>
二进制数据结构:JavaScript中的树和堆简介
查看>>
机器学习与分布式机器学习_这就是为什么任何人都可以学习机器学习的原因
查看>>
django 部署_狂野的Django:部署生存的技巧
查看>>
面向前端开发人员的Visual Studio Code概述
查看>>
2017年最喜欢的Visual Studio代码扩展
查看>>
gvim文本编辑器帮助_如何帮助您的文本编辑器帮助您
查看>>
函数setState是React的未来
查看>>
山东大学有人陪!真的吗?_10,000小时! 您真的需要那么多吗?
查看>>
macos 安装scala_如何在MacOS上安装Scala和Apache Spark
查看>>