一: 什么是进程,线程,协程?
答:
1:进程是操作系统进行资源分配的基本单位。
2:线程是CPU调度的基本单位。
3:协程是开发者自己调度的基本单位。
4:线程依附于进程,协程又叫微线程。
二:进程与线程的区别?
- 全局变量:
- 开销上:
- 创建进程的开销比创建线程的开销大
- 概念上:
- 进程是操作系统资源分配的单位
- 线程是cpu调度的单位
- 关系上:
- 线程依附进程存在,不能单独存在
- 稳定性上
- 多进程编程比单进程多线程编程稳定性更好
三:进程之间如何通信的?
- 管道: 例如linux的|
- 消息队列:A进程与B进程通讯,A进程将消息放入消息队列中,B进程在消息队列中取。
- 共享内存: 我们都知道,系统加载一个进程的时候,分配给进程的内存并不是实际物理内存,而是虚拟内存空间。那么我们可以让两个进程各自拿出一块虚拟地址空间来,然后映射到相同的物理内存中,这样,两个进程虽然有着独立的虚拟内存空间,但有一部分却是映射到相同的物理内存,这就完成了内存共享机制了。
- 信号量:共享内存最大的问题是什么?没错,就是多进程竞争内存的问题,就像类似于我们平时说的线程安全问题。如何解决这个问题?这个时候我们的信号量就上场了。
信号量的本质就是一个计数器,用来实现进程之间的互斥与同步。例如信号量的初始值是 1,然后 a 进程来访问内存1的时候,我们就把信号量的值设为 0,然后进程b 也要来访问内存1的时候,看到信号量的值为 0 就知道已经有进程在访问内存1了,这个时候进程 b 就会访问不了内存1。所以说,信号量也是进程之间的一种通信方式。 - Socket: TCP, UDP聊天器。
四:多线程之间如何同步的呢?
- 全局变量:
- 队列:
- 锁:
- 信号量:
四:你开发过程中哪里用到了进程,线程,协程?
答: 爬虫采用多进程多线程开发,协程没有使用过。
五:什么时间用多进程,什么时间用多线程?
答:
1: 需要频繁创建销毁的优先用线程(进程频繁创建销毁开销大)
2: 需要进行大量计算的优先使用线程(计算占用大量的CPU资源,因此需要线程多一些)
3: 强相关的处理用线程,弱相关的处理用进程(进程之间互相隔离)
4: 可能要扩展到多机分布的用进程,多核分布的用线程