1. Linux下进程的结构:
Linux下一个进程在内存里有三部分的数据:数据段,堆栈段,代码段.
代码段存放了程序代码的数据,假如机器中有数个进程运行相同的一个程序,那么它们可以使用同一个代码段.
堆栈段存放子程序(注意是子程序)的返回地址,子程序的参数以及程序的局部变量.
数据段存放全局变量,常熟以及动态数据分配的数据空间(如用malloc之类的函数取得的空间.)
上面说了,数个进程运行相同的一个程序他们可以使用同一个代码段,但是不能使用同一个堆栈段和数据段.
2.系统调用产生新进程-fork()
在Linux下产生新的进程的系统调用就是fork函数,这个函数名是英文中“分叉”的意思。为什么取这个名字
呢?因为一个进程在运行中,如果使用了fork,就产生了另一个进程,于是进程就“分叉”了,所以这个名字取得很形象。这个子进程和父进程不同的地方只有他的进程ID和父进程ID,其他的都是一样.就象符进程克隆 (clone)自己一样.当然创建两个一模一样的进程是没有意义的.为了区分父进程和子进程,我们必须跟踪fork的返回值. 当fork掉用失败的时候 (内存不足或者是用户的最大进程数已到)fork返回-1,否则fork的返回值有重要的作用.对于父进程fork返回子进程的ID,而对于fork子进程返回0.我们就是根据这个返回值来区分父子进程的.。
注意:fork()调用时是子进程先返回还是父进程先返回不确定,有操作系统控制.
深入分析:
一个程序一调用fork函数,系统就为一个新的进程准备了上面说的三个段,首先,系统让新的进程与旧的进程使用同一个代码段,因为它们的程序还是相同的,对于数据段和堆栈段,系统则复制一份给新的进程,这样,父进程的所有数据都可以留给子进程,但是,子进程一旦开始运行,虽然它继承了父进程的一切数据,但实际上数据却已经分开,相互之间不再有影响了,也就是说,它们之间不再共享任何数据了。而如果两个进程要共享什么数据的话,就要使用另一套函数(shmget,shmat,shmdt等)来操作。现在,已经是两个进程了.
疑问:
如果一个大程序在运行中,它的数据段和堆栈都很大,一次fork就要复制一次,那么fork的系统开销不是很大吗?
回答:
其实UNIX自有其解决的办法,大家知道,一般CPU都是以“页”为单位分配空间的,象INTEL的CPU,其一页在
通常情况下是4K字节大小,而无论是数据段还是堆栈段都是由许多“页”构成的,fork函数复制这两个段,只是“逻辑”上的,并非“物理”上的,也就是说,实际执行fork时,物理空间上两个进程的数据段和堆栈段都还是共享着的,当有一个进程写了某个数据时,这时两个进程之间的数据才有了区别,系统就将有区别的“页”从物理上也分开。系统在空间上的开销就可以达到最小。
现在很多的实现并不做一个父进程数据段和堆的完全拷贝,因为在fork之后经常跟真exec,作为替代使用了写时复制的技术(copy-on-write,COW),这些区域由父子进程共享,而且内核将它们的存取许可权改变为只读的,如果有进程试图修改这些区域,则内核为有关部分,典型的是虚拟存储系统中的“页”做一个拷贝。
一般在fork之后是父进程先执行还是子进程先执行是不确定的,这取决于内核使用的调度算法,如果要求父子进程之间相互同步,则要求某种形式的进程间通讯。
Linux的系统调用函数write是不带缓存的,而标准I/O库是带缓存的。如果标准库输出到终端设备,那么它是行缓存的,否则是全缓存的。标准输出缓存由新行符刷新
文件共享:
父子进程共享一个文件表项---即父子进程对同一个文件使用了一个文件位移量
fork()的例子:
1. #include <stdio.h>
2. #include <unistd.h>/*fork()函数所在的头文件*/
3.
4. int
5. {
6. "before fork()!/n");/*这一句在fork()调用之前将只打印一次*/
7. pid_t pid = fork();
8. "after fork()!/n");/*这一句在fork()调用之后将打印两次*/
9. if(pid < 0)
10. {
11. "fork() error!");
12. //exit(1);
13. }
14. else if(pid ==0)
15. {
16. "Child process is printing!/n");
17. /*打印子进程的id*/
18. "This is child process,it's PID : %d/n", getpid());
19. /*打印(子进程的)父进程的id*/
20. "This is child process,it's parent's PID : %d/n", getppid());
21. }
22. else
23. {
24. "Parent process is printing!/n");
25. "This is parent process,it's PID : %d/n", getpid());/*父进程id*/
26. /*父进程的父进程的id*/
27. "This is parent process,it's parent's PID : %d/n", getppid());
28. }
29. }
----------------------------
执行结果可能是:(父进程先返回)
[zzz@localhost process]$ ./a.out
before fork()!
after fork()!
Parent process is printing!
This is parent process,it's PID : 3106
This is parent process,it's parent's PID : 2604
after fork()!
Child process is printing!
This is child process,it's PID : 3107
This is child process,it's parent's PID : 1
还可能是:(子进程先返回)
before fork()!
after fork()!
Child process is printing!
This is child process,it's PID : 6979
This is child process,it's parent's PID : 6978
after fork()!
Parent process is printing!
This is parent process,it's PID : 6978
This is parent process,it's parent's PID : 2245
-------------------------------------------------------
注意上面的结果:第一种结果子进程的父进程id打印的是1,而不是3106,为什么?
因为父进程比子进程提前终止了!!那么子进程就变成孤儿进程了,那么它就由INIT进程收养!!所以父进程是1,init进程是系统初始化的进程.
第二种结果:子进程先返回,父进程还没终止,所以打印出了父进程的id是6978,和父进程自己打印的id一样.
3.vfork()函数
vfork函数的调用序列和返回值与fork相同,但语义不同。vfork用于创建一个新进程,该进程的目的是exec一个新进程。vfork和fork一样都创建一个子进程,
但是它并不将父进程的地址空间完全复制到子进程中,因为子进程会立即调用exec或exit,于是也就不会存访该地址空间。不过在子进程调用exec或exit之前,它在
父进程的空间中运行。这种工作方式在某些UNIX的页式虚存中提高了效率
vfork和fork之间的另一区别是,vfork保证子进程先运行,它在调用exec或exit之后父进程才可能被调度运行。如果在调用这两个函数之前子进程依赖父进程的
进一步动作,则会导致死锁。
4.exit函数
进程有三种正常终止法和两种异常终止法
1>正常终止
a.在main函数中执行return语句,等效于调用exit
b.调用exit函数,该函数由ANSI C定义,其操作包括调用各终止处理程序,然后关闭所有标准I/O流,因为ANSI C不处理文件描述符,多进程以及作业控制
所以这一定义对UNIX是不完整的
c.调用_exit系统调用函数,它并不执行标准I/O缓存的刷新操作,它处理UNIX特定的细节,_exit是由POSIX说明的
2>异常终止
a.调用abort,它产生SIGABRY信号
b.当进程接收到某个信号时。
不管进程如何终止,最后都会执行内核中的同一段代码,这段代码为进程关闭所有打开的文件描述符,释放它所使用的存储器等。
对于上面任何一种终止情况,我们都希望终止进程能够通知父进程它是如何终止的,对exit和_exit,是依靠传递给他们的退出状态实现的;在异常终止情况下,
内核(非进程本身)会产生一个指示其异常终止原因的终止状态,在任意一种情况下,该终止进程的父进程都能使用wait或waitpid函数获取其终止状态。
5.wait和waitpid函数
当一个进程正常或异常终止时,内核就向其父进程发送SIGCHLD信号,因为子进程终止是一个异步事件,所以这种信号也是内核向父进程发出的异步通知。
调用wait和waipit可能会导致:
1>阻塞(当父进程的所有子进程都在运行时)
2>一个子进程已经终止,正等待父进程存取其终止状态
3>出错并立即返回(该进程没有任何子进程)
如果进程由于接收到SIGCHLD信号而调用wait则可期望wait立即返回,但是如果在一个任意时刻调用wait,可能会阻塞
#include <sys/types.h>
#include <sys/wait.h>
pid_t wait(int &status);
pid_t waitpid(pid_t pid, int *stat_loc, int options);
两个函数的区别是:
在一个子进程终止前,调用wait会使调用者阻塞,而waitpid有一选择项,可以使waitpid不阻塞。
waitpid并不等待第一个终止的子进程,可以控制它所等待的进程。
如果是一个子进程已经终止,是一个僵死进程,则wait立即返回并取得该子进程的状态,否则wait一直阻塞直到一个进程结束。