动态语言的并发处理
相关概念
- 什么是进程、线程、协程
- 什么是多进程、多线程
- 同步阻塞模型
- 异步非阻塞模型
- php并发编程实践
什么是进程、线程、协程
进程
进程是一个执行中的程序
进程的三态模型:多道程序系统中,进程在处理器上交替运行,状态不断的发生变化
运行、就绪、阻塞
运行:当一个进程在处理机上运行时,则称该进程处于运行状态
就绪:当一个进程获得了除处理机以为的一切所需资源,一旦得到处理机即可运行,则称此进程处于就绪状态
阻塞:也成等待或睡眠状态,一个进程正在等待某一时间发生而暂停停止运行,这时即使把处理机分配给进程也无法运行
进程的五态模型 对于一个世纪的系统,进程的状态以及转换更为复杂
新建态:对应于进程刚刚被创建时没有被提交的状态,并且等待系统完成创建进程的所有必要信息
终止态:进程已经结束运行,回收进行控制块以外的其他资源,并让其他进程从进程控制块中收集有关信息
活跃就绪:进程在主存并且可被调度的状态
静止就绪:进程被对换到辅存时的就绪状态,是不能被直接调度的状态,只有当主存中没有活跃就绪态进程或者是挂起就绪进程具有更高的优先级,系统将把挂起就绪状态进程调回主存并转换为活跃就绪
活跃阻塞:指进程在主存,一旦等待的事件产生便进入活跃就绪状态
静止阻塞:进程对换到辅存时的阻塞状态,一旦等待事件产生便进入静止就绪状态
线程
由于用户的并发请求,为每一个请求都创建一个进程显然是行不通的,从系统资源开销方面或者是响应用户请求的效率方面来看,因此操作系统中线程的概念便被引进了
线程,有时候被称为轻量级进程
线程是进程中的一个实体,是被系统独立调度和分配的基本单位,线程自己不拥有系统资源,只拥有一点儿在运行中必不可少的资源,但是她可以同属一个进程的其他线程共享进程所拥有的全部资源
一个线程可以创建和撤销另一个线程,同一个进程中的多个线程之间可以并发执行
线程是程序中一个单一的顺序控制流程。进程内一个相对独立的可以调度的执行单元,是系统独立调度和分配CPU的基本单位,指运行程序的调度单位
在单个程序中同时运行多个线程完成不同的工作,称为多线程
每一个程序至少有一个线程,如果只有一个线程,那就是程序本身了
线程的三种状态:就绪状态,运行状态,阻塞状态
协程
协程是一种用户台的轻量级线程,协程的调度完全由用户控制。
线程与进程的区别
- 线程是进程内的一个执行单元,进程内至少有一个线程,他们共享进程的地址空间,而进程有自己独立的地址空间
- 进程是资源分配和拥有的但愿,同一个进程内的线程共享进程的资源
- 线程是处理器调度的基本单位,但进程不是
-
两者均可并发执行
-
每个独立的线程有一个程序运行的入口,顺序执行序列和程序的出口,但是线程不能独立执行,必须已存在应用程序中,由应用程序提供多个线程执行控制
线程和协程的区别
-
一个线程可以有多个协程,一个进程也可以单独拥有多个协程
-
线程进程都是同步机制,而协程则是异步
- 协程可以保留上一次调用时的状态,每次过程重入时,就相当于进入上一次调用的状态
什么是多进程、多线程
多进程:同一时间里,同一个计算机系统中如果允许两个或者两个以上的进程处于运行状态,这就是多进程
多开一个进程,多分配一份资源,进程间通讯不方便
多线程:线程就是吧一个进程分诶很多片,每一个片都可以是一个独立的流程
例子
单进程单线程:一个人在一个桌子上吃菜
单进程多线程:多个人在同一个桌子上吃采
多进程单线程:多个人每个人在自己的桌子上吃菜
同步阻塞
多进程:最早的服务器端的程序都是通过多进程、多线程来解决并发的IO问题
一个请求创建一个进程,然后子进程进入循环同步阻塞的与客户端连接并且进行交互,手法处理数据
多线程:线程中可以直接向客户端连接发送数据
步骤:
创建一个socket
进入while循环,阻塞在进程accept操作上,等待客户端连接进入
主进程在多进程模式下通过fork创建子进程
多线程模型下可以创建子线程
子进程/线程创建成功后进入while循环,阻塞在recv调用上,等待客户端向服务器发送数据
收到数据后服务器程序进程处理然后使用send向客户端发送响应
当客户端连接关闭时,子进程/子线程退出并销毁所有资源。主进程/线程会回收掉此子进程/线程
缺点:严重依赖进程来解决并发问题,会造成严重消耗
异步非阻塞
现在各种高并发异步IO的服务器程序都是基于epoll实现的
IO复用异步非阻塞程序使用景点的Reactor模型,Reactor顾名思义就是反应堆的意思,它本身不处理任何数据首发,只是可以监听一个socket句柄的时间变化
Add:添加一个socket 到 Reactor
Set:修改socket对应的时间,如可读可写
Del:从Reactor中移除,不再监听事件
Callback:事件发生后回调指定的函数
Nginx:使用的就是多线程的Reactor
Swoole:使用的是多线程的Reactor和多进程的Worker
PHP并发编程实践
- php的Swoole扩展
php的异步、并行、高性能网络通信引擎,使用纯C语言编写,提供了PHP语言的异步多线程服务器,异步TCP/UDP网络客户端,异步Mysql,异步Redis,数据库连接池,AsyncTask,消息队列,毫秒定时器,异步文件读写,异步DNS查询
除了异步IO支持之外,Swoole为PHP多进程的模式设计了多个并发数据结构和IPC通信机制,可以大大简化多进程并发编程的工作
Swoole2.0支持了类似Go语言的协程,可以使用完全同步的代码实现异步程序
-
Swoole的异步Mysql实现
1
2
3
4
5
6
7
8$db = new Swoole\MySQL;
$server = array('host'=>'','user'=>'','password'=>'','database'=>'');
$db->connect($server,function($db,$result) {
$db->query('show tables',function(Swoole\MySQL $db,$result) {
//do some thing;
});
}); -
消息队列
场景说明:用户注册后,需要发注册邮件和注册短信
串行方式:将注册信息写入数据库成功后,发送注册邮件,再发送注册短信
并行方式:将注册信息写入数据库成功后,发送注册邮件的同时发送注册短信
消息队列:将注册信息写入数据库成功后,将成功的信息写入队列,此时直接返回成功给用户,写入队列的时间非常短,可以忽略不计,然后异步发送邮件和短信
- 应用解耦
场景说明:用户下凡后,订饭系统需要通知库存系统
加入库存系统无法访问,则订饭减库存将失败,从而导致订单失败,订单系统与库存系统解耦
引用队列,用户下单后,订单系统完成持久化处理,将消息写入消息队列,返回用户下单成功
订阅下单的消息,采用拉/推的方式,获取下单信息,库存系统根据下单信息,进行库存处理
- 流量削峰
应用场景:秒杀活动,流量瞬间激增,服务器压力大
用户发起请求,服务器接收后,先写入消息队列,加入消息队列长度超过最大值,则直接报错或者提示用户
后续的程序读取消息队列,去处理
控制请求量
缓解高流量
- 日志处理
应用场景:解决大量日志的传输
日志采集程序将程序写入消息队列,然后通过日志处理程序的订阅消费日志
- 消息通讯
应用场景:聊天室
多个客户端订阅同一个主题,进行消息发布和接收
- 常见消息队列产品
Kafka、ActiveMQ、ZeroMQ、RabbitMQ、Redis等
- 接口的并发请求
curl_multi_init
转载:https://zhyunfe.github.io/2017/10/04/php-interview-prepare-hc-4/