进程调度器

对于CPU进程调度,目前主流的方式是两种,第一种是像window那样抢占式调度,每一个CPU可能会出现调度时间分配不等的情况,这是由于历史硬件单核性能强多核性能弱考虑。

而另一种是时间分片的方式,时间分片是Linux 常见的进程调度器,特点是每一个进程有近似相等的CPU使用权,在使用完成之后立马交给下一个进程完成工作,使用分片的方式虽然可能导致一些重要任务延迟,但这样的处理和调度方式使得系统最为稳定。

一些结论

针对Linux进程调度可以有下面的思考:

  • 每一个CPU同一时间只能调度一个进程
  • 每一个进程有*近乎相等的执行时间
  • 对于逻辑CPU而言进程调度使用轮询的方式执行,当轮询完成则回到第一个进程反复
  • 进程数量消耗时间和进程量成正比

对于进程调度来说不能保证一个程序是连续完成的,由于CPU调度和进程切换,上下文也会出现切换情况。

进程状态

对于大部分进程来说,当我们不使用的时候多数处于睡眠状态。

除了睡眠状态之外,进程还有下面几种状态

  • 运行状态:获得CPU调度,执行进程任务
  • 僵死状态:进程等待结束,等待父进程回收
  • 就绪状态:具备运行条件,等待CPU分配
  • 睡眠状态:进程不准备运行除非某种条件触发才会获得CPU调度分配。

对于处在睡眠态的进程触发运行态的条件如下

  • 外部存储器访问,
  • 用户键入或者鼠标操作触发事件
  • 等待指定时间
  • 等待指定时间

通过​​ps ax​​命令可以查看当前的进程状态,下面的案例以个人的Mac电脑为例:

MacBook-Pro ~ % ps ax

PID TT STAT TIME COMMAND
32615 ?? Ss 0:00.11 /usr/libexec/nearbyd

32632 ?? Ss 0:00.51 /System/Library/CoreServices/Screen Time.app/Content

32634 ?? Ss 0:00.02 /System/Library/PrivateFrameworks/Categories.framewo

32635 ?? S 0:00.12 /System/Library/CoreServices/iconservicesagent

32636 ?? Ss 0:00.05 /System/Library/CoreServices/iconservicesd

32671 ?? S 0:02.44 /Applications/Microsoft Edge.app/Contents/Frameworks

32673 ?? S 0:02.86 /Applications/Microsoft Edge.app/Contents/Frameworks

32678 ?? Ss 0:00.17 /System/Library/PrivateFrameworks/UIFoundation.frame

32726 ?? S 0:00.07 /System/Library/Frameworks/CoreServices.framework/Fr

32736 ?? S 0:00.08 /System/Library/Frameworks/CoreServices.framework/Fr

32738 ?? S 0:00.75 /System/Applications/Utilities/Terminal.app/Contents

32739 ?? Ss 0:00.02 /System/Library/PrivateFrameworks/Categories.framewo

32746 ?? Ss 0:00.03 /System/Library/Frameworks/Metal.framework/Versions/

32740 s000 Ss 0:00.02 login -pf xxxxxx

32741 s000 S 0:00.03 -zsh

32750 s000 R+ 0:00.01 ps ax

s表示sleep,d表示此时可能在等待磁盘IO,但是如果长时间处于D状态则可能是磁盘IO等待超时或者内核可能发生故障。

Linux 进程调度器入门_多核

那么如果只执行一个进程,同时在进程中间休眠过一次,那么休眠的时候进程在干什么?

此时进程会进入一个空进程的模式轮询,但是空进程不是没有事做,而是需要调用一些维持系统运行的线程,为了保证系统正常稳定运行。

如果只有CPU和空闲进程,那么同样会不断的切换睡眠态和运动态,运动态获取用户输入操作完成动作,睡眠态则执行一些轻量操作。

针对睡眠态的进程会有如下特点:

  • 遵循同一时间CPU只能完成一个进程操作
  • 睡眠态不占用CPU时间,也就是完全不管。

吞吐量和延迟

  1. 吞吐量:处理完成的进程数量 / 耗费时间
  2. 延迟:结束处理时间 - 开始处理时间

通过这两点可以总结几个规则:吞吐量的上限是进程的数量多过逻辑CPU的数量,则再增加进程无法增加吞吐量,另外进程中的延迟总是平均的,也就是说多个进程执行会获得近似平均的延迟,最后进程越多延迟越高。

但是现实系统没有那么多理想情况,多数情况是下面几种:

  • 空闲进程,此时吞吐量很低,因为很多逻辑CPU都在睡眠状态
  • 进程运行态,但是没有就绪,比较理想,CPU可以安排到下一次处理,此时虽然不会延长,但是会出现CPU空闲的情况
  • 进程运行态,同时都就绪,此时就好像赛跑,但是只有一个跑道,跑得快的可以抢着多处理,但是总归都要跑完赛道,所以此时延迟变长

最后其实由于程序编写都是单线程的情况,一核运行,多核围观或许在过去更位普遍。

最终主要的优化方式是使用 ​​sar​​ 命令找到运行时间和开销最大进程,同时把一些死进程kill掉。

多CPU调度情况

因为是分片时间每一个进程用一个CPU工作,那么分配和调度CPU安排工作又是如何的? 主要有两种方式,第一种是通过轮询的负载均衡,另一种是全局分配,把任务分配给空闲进程的逻辑CPU。

负载均衡是CPU遇到进程任务依次安排工作,当最后一个CPU安排完成之后,则再回到第一个CPU进行分配,同时都是对于进程执行一定的时间,也就是说出现CPUa处理一部分,另一部分可能是CPUb完成。 全局分配的方式比较简单,就是把任务分配给处于空闲进程的逻辑CPU完成工作。

查看系统逻辑CPU的命令如下:

​grep -c processor /proc/cpuinfo​

多核cpu通常只有在同时运行多个进程的时候才会发挥作用,但是并不是说有多少核心就有多少倍性能,因为大部分时候进程很少很多CPU都在睡眠态度

如果进程超过逻辑CPU数量,无论怎么增加进程都不会提高处理速度

最后处于睡眠状态的进程其实可以指定睡眠时间,通过sleep函数调用完成进程休眠的操作。