Linux & Unix架构图:

Java用户态到用户态转变 java用户态和内核态_Java用户态到用户态转变


从图上我们可以看出来通过系统调用将 Linux 整个体系分为用户态和内核态(或者说内核空间和用户空间)。

  • 系统调用
    为了使应用程序访问到内核管理的资源例如 CPU,内存,I/O。内核必须提供一组通用的访问接口,这些接口就叫系统调用。例如:用户态想要申请一块20K大小的动态内存,就需要brk系统调用,将数据段指针向下偏移,如果用户态多处申请20K动态内存,同时又释放呢?这个内存的管理就变得非常的复杂。
  • Shell
    顾名思义,就是外壳的意思。就好像把内核包裹起来的外壳。它是一种特殊的应用程序,俗称命令行。为了方便用户和系统交互,一般一个Shell对应一个终端,呈现给用户交互窗口。当然Shell也是编程的,它有标准的shell语法,符合其语法的文本叫Shell脚本。很多人都会用Shell脚本实现一些常用的功能,可以提高工作效率。
  • 库函数
    就是屏蔽这些复杂的底层实现细节,减轻程序员的负担,从而更加关注上层的逻辑实现。它对系统调用进行封装,提供简单的基本接口给用户,这样增强了程序的灵活性,当然对于简单的接口,也可以直接使用系统调用访问资源,例如:open(),write(),read()等等。库函数根据不同的标准也有不同的版本,例如:glibc库,posix库等。

1.权限保证安全

  • 在CPU的所有指令中,有一些指令是非常危险的,如果错用,将导致整个系统崩溃。比如:清内存、设置时钟等。如果所有的程序都能使用这些指令,那么你的系统一天死机N回就不足为奇了。
  • 所以,CPU将指令分为特权指令和非特权指令,对于那些危险的指令,只允许操作系统及其相关模块使用,普通的应用程序只能使用那些不会造成灾难的指令。
  • Intel的CPU将特权级别分为4个级别:RING0、RING1、RING2、RING3

2.内核态

  • 内核空间(进程共享)
  • 其实从本质上说就是我们所说的内核,控制计算机的硬件资源,并提供上层应用程序运行的环境。
  • 内核空间(Ring 0)具有最高权限,可以直接访问所有资源;
  • 内核态
  • 表象:当一个任务(进程)执行系统调用而陷入内核代码中执行时,我们就称进程处于内核运行态(或简称为内核态)
  • 本质:此时处理器处于特权级最高的(0级)内核代码中执行。可以执行任何cpu指令,也可以引用任何内存地址,包括外围设备, 例如硬盘, 网卡,权限等级最高。

3.用户态

  • 用户空间
  • 各个应用程序的内存空间,主要指自己写的代码
  • 用户空间(Ring 3)只能访问受限资源,不能直接访问内存等硬件设备,必须通过系统调用陷入到内核中,才能访问这些特权资源。
  • 用户态
  • 表象:当进程在执行用户自己的代码时,则称其处于用户运行态(用户态)
  • 本质:即此时处理器在特权级最低的(3级)相较于内核态有较低的执行权限,很多操作是不被操作系统允许的,原因简单来说就是用户态出现问题(自己写的bug),也不能让操作系统崩溃

大多数时间各类程序都是执行在用户态下,毕竟内核就是基础而已。

4.状态转换

用户程序跑在用户态下,但是如果需要执行一些操作例如申请内存,网络读写时,自己的权限不够,就需要转换到内核态去让内核的code帮忙干一些事情。下面三个方式是

  • 系统调用
    这是用户态进程主动要求切换到内核态的一种方式,用户态进程通过系统调用申请使 用操作系统提供的服务程序完成工作,比如fork()实际上就是执行了一个创建新进程的系统调用。而系统调用的机制其核心还是使用了操作系统为用户 特别开放的一个中断来实现,例如Linux的int 80h中断。会发生特权切换
  • 异常
    当CPU在执行运行在用户态下的程序时,发生了某些事先不可知的异常,这时会触发由当前运行进程切换到处理此异常的内核相关程序中,也就转到了内核态,比如缺页异常。
  • 外围设备的中断
    当外围设备完成用户请求的操作后,会向CPU发出相应的中断信号,这时CPU会 暂停执行下一条即将要执行的指令转而去执行与中断信号对应的处理程序,如果先前执行的指令是用户态下的程序,那么这个转换的过程自然也就发生了由用户态到 内核态的切换。比如硬盘读写操作完成,系统会切换到硬盘读写的中断处理程序中执行后续操作等。

很多博客都提到了一个状态转换的例子:c语言在malloc的时候需要涉及到从用户态到内核态的转换,malloc是个函数,所以算作系统调用,是用户态的主动申请转换。但是在实际实现中,未必一定需要进入内核态拿到新的内存,详细看这个博客:

为什么两者切换耗时?

  • linux下每个进程的栈有两个,一个是用户态栈,一个是内核态栈。在需要从用户态栈切换到内核的时候,需要进行执行栈的转换,保存用户态的状态,所以,需要保存 CPU 寄存器状态的程序计数器,然后执行内核态操作,操作完成后要恢复现场,切换到用户态,这个过程是耗时的。当然还有很多细节,这里只了解宏观上的原因。
  • 很多人都说 mutex 加锁解锁很慢,为什么呢,因为他也是需要从用户态到内核态的切换,因此有一些无锁技巧例如 CAS(Compare and swap),还有spin lock这种停等不作context切换的锁。