Linux系统编程（8）—— 进程之进程控制函数fork

作者：羊村懒王 | 2024-03-08 13:59:41

踩

fork()函数通过系统调用创建一个与原来进程几乎完全相同的进程，也就是两个进程可以做完全相同的事，但如果初始参数或者传入的变量不同，两个进程也可以做不同的事。

一个进程调用fork()函数后，系统先给新的进程分配资源，例如存储数据和代码的空间。然后把原来的进程的所有值都复制到新的新进程中，只有少数值与原来的进程的值不同。相当于克隆了一个自己。

函数原型


#include<unistd.h>
#include<sys/types.h>
 
pid_t fork( void);

返回值：若成功调用一次则返回两个值，子进程返回0，父进程返回子进程ID；否则，出错返回-1（pid_t 是一个宏定义，其实质是int 被定义在#include<sys/types.h>中）

函数说明：

一个现有进程可以调用fork函数创建一个新进程。由fork创建的新进程被称为子进程（child process）。fork函数被调用一次但返回两次。两次返回的唯一区别是子进程中返回0值而父进程中返回子进程ID。

子进程是父进程的副本，它将获得父进程数据空间、堆、栈等资源的副本。注意，子进程持有的是上述存储空间的“副本”，这意味着父子进程间不共享这些存储空间。

UNIX将复制父进程的地址空间内容给子进程，因此，子进程有了独立的地址空间。在不同的UNIX (Like)系统下，我们无法确定fork之后是子进程先运行还是父进程先运行，这依赖于系统的实现。所以在移植代码的时候我们不应该对此作出任何的假设。

那么为什么fork会返回两次？由于在复制时复制了父进程的堆栈段，所以两个进程都停留在fork函数中，等待返回。因此fork函数会返回两次，一次是在父进程中返回，另一次是在子进程中返回，这两次的返回值是不一样的。

fork调用的一个奇妙之处就是它仅仅被调用一次，却能够返回两次，它可能有三种不同的返回值：

1、在父进程中，fork返回新创建子进程的进程ID；

2、在子进程中，fork返回0；

3、如果出现错误，fork返回一个负值。

在fork函数执行完毕后，如果创建新进程成功，则出现两个进程，一个是子进程，一个是父进程。在子进程中，fork函数返回0，在父进程中，fork返回新创建子进程的进程ID。我们可以通过fork返回的值来判断当前进程是子进程还是父进程。

引用一位网友的话来解释fork函数返回的值为什么在父子进程中不同。“其实就相当于链表，进程形成了链表，父进程的fork函数返回的值指向子进程的进程id, 因为子进程没有子进程，所以其fork函数返回的值为0.

调用fork之后，数据、堆栈有两份，代码仍然为一份但是这个代码段成为两个进程的共享代码段都从fork函数中返回，箭头表示各自的执行处。当父子进程有一个想要修改数据或者堆栈时，两个进程真正分裂。

fork()在Linux系统中的返回值是没有NULL的.

出错返回错误信息（Error Codes）如下:

EAGAIN

达到进程数上限.

ENOMEM

没有足够空间给一个新进程分配.

fork出错可能有两种原因：

　　1)当前的进程数已经达到了系统规定的上限，这时errno的值被设置为EAGAIN。

　　2)系统内存不足，这时errno的值被设置为ENOMEM。

fork函数的特点概括起来就是“调用一次，返回两次”，在父进程中调用一次，在父进程和子进程中各返回一次。

fork的另一个特性是所有由父进程打开的描述符都被复制到子进程中。父、子进程中相同编号的文件描述符在内核中指向同一个file结构体，也就是说，file结构体的引用计数要增加。

下面是一个例子：


#include <unistd.h> 
#include <sys/types.h> 
#include <stdio.h> 
int main(void) 
{ 
   pid_t pid; 
   pid=fork(); 
   switch (pid) 
   { 
   case -1: 
       perror("fork error"); 
       exit(1); 
   case 0: 
       printf("I am the child process, my process id is %d/n",getpid()); 
       break; 
   default: 
       printf("I am the parent process, my process id is %d/n",getpid()); 
       break; 
   } 
    return 0; 
}

　　创建新进程成功后，系统中出现两个基本完全相同的进程，这两个进程执行没有固定的先后顺序，哪个进程先执行要看系统的进程调度策略。

　　每个进程都有一个独特(互不相同)的进程标识符(process ID)，可以通过getpid()函数获得，还有一个记录父进程pid的变量，可以通过getppid()函数获得变量的值。

　　fork执行完毕后，出现两个进程，

为什么两个进程的内容完全一样，但是打印的结果不一样呢，那是因为判断条件的原因，上面列举的只是进程的代码和指令，还有变量。

　　执行完fork后，进程1的变量为count=0，fpid!=0(父进程)。进程2的变量为count=0，fpid=0(子进程)，这两个进程的变量都是独立的，存在不同的地址中，不是共用的，这点要注意。可以说，我们就是通过fpid来识别和操作父子进程的。iude

　　还有人可能疑惑为什么不是从#include处开始复制代码的，这是因为fork是把进程当前的情况拷贝一份，执行fork时，进程已经执行完了int count=0;fork只拷贝下一个要执行的代码到新的进程。(自己添加：因为FORK是复制产生一个新的进程，因此新的进程与旧的的进程之间的上下文，如寄存器上下文等是一致的，也就是说两个进程的变量值，PC指针值也是一样的，因此两个进程都是在同一个位置开始运行)

转载于:https://www.cnblogs.com/new0801/p/6177034.html

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/羊村懒王/article/detail/210514