一: 什么是进程,线程,协程?

答:

1:进程是操作系统进行资源分配的基本单位。

2:线程是CPU调度的基本单位。

3:协程是开发者自己调度的基本单位。

4:线程依附于进程,协程又叫微线程。

二:进程与线程的区别?


  • 全局变量:


进程不能共享全局变量线程可以共享全局变量,出现资源竞争问题,可以通过互斥锁和线程同步解决。

  • 开销上:
  • 创建进程的开销比创建线程的开销大
  • 概念上:

  • 进程是操作系统资源分配的单位
  • 线程是cpu调度的单位

  • 关系上:
  • 线程依附进程存在,不能单独存在
  • 稳定性上
  • 多进程编程比单进程多线程编程稳定性更好

三:进程之间如何通信的?


  • 管道: 例如linux的|
  • 消息队列:A进程与B进程通讯,A进程将消息放入消息队列中,B进程在消息队列中取。
  • 共享内存: 我们都知道,系统加载一个进程的时候,分配给进程的内存并不是实际物理内存,而是虚拟内存空间。那么我们可以让两个进程各自拿出一块虚拟地址空间来,然后映射到相同的物理内存中,这样,两个进程虽然有着独立的虚拟内存空间,但有一部分却是映射到相同的物理内存,这就完成了内存共享机制了。
  • 信号量:共享内存最大的问题是什么?没错,就是多进程竞争内存的问题,就像类似于我们平时说的线程安全问题。如何解决这个问题?这个时候我们的信号量就上场了。
    信号量的本质就是一个计数器,用来实现进程之间的互斥与同步。例如信号量的初始值是 1,然后 a 进程来访问内存1的时候,我们就把信号量的值设为 0,然后进程b 也要来访问内存1的时候,看到信号量的值为 0 就知道已经有进程在访问内存1了,这个时候进程 b 就会访问不了内存1。所以说,信号量也是进程之间的一种通信方式。
  • Socket: TCP, UDP聊天器。

四:多线程之间如何同步的呢?


  • 全局变量:
  • 队列:
  • 锁:
  • 信号量:

四:你开发过程中哪里用到了进程,线程,协程?

答: 爬虫采用多进程多线程开发,协程没有使用过。

五:什么时间用多进程,什么时间用多线程?

答:

1: 需要频繁创建销毁的优先用线程(进程频繁创建销毁开销大)

2: 需要进行大量计算的优先使用线程(计算占用大量的CPU资源,因此需要线程多一些)

3: 强相关的处理用线程,弱相关的处理用进程(进程之间互相隔离)

4: 可能要扩展到多机分布的用进程,多核分布的用线程