fork函数初识

在linux中fork函数时非常重要的函数,它从已存在进程中创建一个新进程。新进程为子进程,而原进程为父进程。

#include<unistd.h>
pid_t fork(void)
//返回值:子进程中返回0,父进程返回子进程id,出错返回-1

通过系统调用 execlp()(这是系统调用 exec() 的一个版本),子进程采用 UNIX 命令 /bin/ls(用来列出目录清单)来覆盖其地址空间。通过系统调用 wait(),父进程等待子进程的完成。当子进程完成后(通过显示或隐式调用 exit()),父进程会从 wait() 调用处开始继续,并且结束时会调用系统调用 exit()。
进程创建_fork函数
进程调用 fork,当控制转移到内核中的fork代码后,内核做:

  • 分配新的内存块和内核数据结构给子进程
  • 将父进程部分数据结构内容拷贝到子进程
  • 添加子进程到系统进程列表当中
  • fork()返回,开始调度器调度
    进程创建_子进程_02

当一个进程调用 fork()之后,就有两个二进制代码相同的进程。而且他们都运行到相同的地方。但每个进程都可以开始它们自己的旅程。看如下程序:

   #include<stdio.h>
   #include<unistd.h>
   #include<stdlib.h>
   
   int main()
   {
     pid_t id;
   
     printf("Before: pid is %d\n", getpid());
  
     if((id = fork()) == -1)
     {
       perror("fork error");
       return 1;
     }
                                                                                                                                         
     printf("After: pid is %d, fork return %d\n", getpid(), id);
     sleep(1);
     return 0;
   }


运行结果:
进程创建_fork函数_03
这里看到了三行输出,一行before,两行after。进程11175先打印before消息,然后它有打印after。另一个after 消息有11176打印的。注意到进程11176没有打印before,为什么呢?如下图
进程创建_fork函数_04
所以,fork之前父进程独立执行,fork之后,父子两个执行流分别执行。注意,fork之后,谁先执行完全由调度器决定。

fork函数返回值

  • 子进程返回0
  • 父进程返回子进程的pid

写时拷贝

通常,父子代码共享,父子再不写入时,数据也是共享的,当任意一方试图写入,便以写时拷贝的方式各自一份副本。具体见下图:
进程创建_父进程_05

fork常规用法

  • 一个父进程希望复制自己,使父子进程同时执行不同的代码段。例如,父进程等待客户端请求,生成子 进程来处理请求。
  • 一个进程要执行一个不同的程序。例如子进程从fork返回后,调用exec函数。

fork调用失败的原因

  • 系统中有太多的进程
  • 实际用户的进程数超过了限制