当前位置:   article > 正文

Linux系统调用之fork,getpid,getppid函数(进程相关函数,与G老师的对话,必看!)

getpid

前言

如果,想要深入的学习Linux系统调用中的fork,getpid,getppid函数,还是需要去自己阅读Linux系统中的帮助文档。
具体输入命令:

man 2 fork/getpid/getppid

即可查阅到完整的资料信息。

fork函数

fork() 函数是 UNIX/Linux 系统中的一个系统调用 (system call),它会创建一个新的进程,称为子进程,该子进程是原始进程的副本。

调用 fork() 后,两个进程都将从当前指令序列的下一条指令开始运行,但子进程完全复制了父进程的内存空间、打开文件等状态信息(子进程获得了对共享内存区域的独立控制权,即父进程和子进程之间不会相互干扰)。

我们可以通过返回值来区分是在哪个进程中。具体地讲,在父进程中,它返回子进程的 Process ID (PID) ,而在子进程中,它返回0.

fork()的函数原型是长这样的:

pid_t fork(void);

在使用这个函数之前,我们需要往C/C++文件中导入这些头文件:

#include <sys/types.h>
#include <unistd.h>

下面用一个代码例子来演示一下fork函数的作用:

#include <sys/types.h>
#include <unistd.h>
#include <stdio.h>

int main() {

    int num = 10;

    // 创建子进程
    pid_t pid = fork();

    // 判断是父进程还是子进程
    if(pid > 0) {
        // printf("pid : %d\n", pid);
        // 如果大于0,返回的是创建的子进程的进程号,当前是父进程
        printf("i am parent process, pid : %d, ppid : %d\n", getpid(), getppid());

        printf("parent num : %d\n", num);
        num += 10;
        printf("parent num += 10 : %d\n", num);


    } else if(pid == 0) {
        // 当前是子进程
        printf("i am child process, pid : %d, ppid : %d\n", getpid(),getppid());
       
        printf("child num : %d\n", num);
        num += 100;
        printf("child num += 100 : %d\n", num);
    }

    // for循环
    for(int i = 0; i < 3; i++) {
        printf("i : %d , pid : %d\n", i , getpid());
        sleep(1);
    }

    return 0;
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39

输出内容:

nowcoder@nowcoder:~/Linux/lession18$ cd "/home/nowcoder/Linux/lession18/" && gcc fork.c -o fork && "/home/nowcoder/Linux/lession18/"fork
i am parent process, pid : 29230, ppid : 28564
parent num : 10
parent num += 10 : 20
i : 0 , pid : 29230
i am child process, pid : 29231, ppid : 29230
child num : 10
child num += 100 : 110
i : 0 , pid : 29231
i : 1 , pid : 29230
i : 1 , pid : 29231
i : 2 , pid : 29230
i : 2 , pid : 29231
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

在这个例子中,代表父进程的 if (pid > 0) 分支和代表子进程的 if (pid == 0) 分支会同时执行。

简单来说,fork() 的作用就是在程序中生成一个新的进程,这个新的进程和原有进程基本一致,除了 fork() 的返回值。这两个进程几乎是同时运行的。一般情况下,父进程将 fork() 的返回值保存,并通过这个唯一的返回值标识子进程。子进程也可以通过 getppid 获得其父进程的 PID.

实际上,更准确来说,Linux 的 fork() 使用是通过写时拷贝 (copy- on-write) 实现。写时拷贝是一种可以推迟甚至避免拷贝数据的技术。内核此时并不复制整个进程的地址空间,而是让父子进程共享同一个地址空间。只用在需要写入的时候才会复制地址空间,从而使各个进行拥有各自的地址空间。也就是说,资源的复制是在需要写入的时候才会进行,在此之前,只有以只读方式共享。

大概就向图中一样:
在这里插入图片描述

注意:fork之后父子进程共享文件,
fork产生的子进程与父进程相同的文件文件描述符指向相同的文件表,引用计数增加,共享文件偏移指针。

getpid函数

获取当前进程的pid。这个pid与ps命令里显示的进程id一致。

getppid函数

获取当前进程的父进程的id。这个ppid与ps命令里显示的进程id一致。

忽如其来的问答 (以下部分对理解内存方面的一些东西非常重要)

问:

父进程fork以后,子进程共享父进程的文件描述符表,这句话怎么理解。
Linux系统是不是有一个机制叫做”读时共享,写时拷贝“的机制。那我是不是理解为,父进程fork以后,在没有写入之前,父子进程共享一个文件描述符表。但是,一旦父进程或者子进程任意一方只要开始执行写入操作以后,子进程就会复制父进程写入之前的文件描述符表,自己单独一份呢?你看我理解的对不对

答:

您对子进程共享父进程的文件描述符表的理解部分正确,但与“读时共享,写时拷贝”(Copy-on-Write)机制有一些混淆。让我分别解释这两个概念。

  • 子进程共享父进程的文件描述符表
    当父进程使用 fork 系统调用创建一个子进程时,子进程会继承父进程的文件描述符表。这意味着子进程会获得父进程打开的所有文件和 I/O 资源的文件描述符实际上,子进程会得到父进程文件描述符表的一个副本。因此,它们并不是共享同一个文件描述符表,而是子进程拥有父进程文件描述符表的副本。然而,由于子进程和父进程的文件描述符都指向同一个文件或 I/O 资源,所以在某种程度上可以认为它们共享文件描述符。

  • “读时共享,写时拷贝”(Copy-on-Write)机制
    这是 Linux 系统在进行内存管理时所使用的一种优化技术。当父进程创建子进程时,操作系统并不会立即为子进程分配所有内存资源,而是让子进程和父进程共享相同的物理内存页。只有当父进程或子进程试图修改某个内存页时,系统才会复制该内存页,为执行写入操作的进程创建一个新的物理内存页。这样做的好处是节省内存资源,同时提高了 fork 操作的性能。

  • 综上所述,父子进程在 fork 之后共享相同的文件描述符,但它们拥有各自的文件描述符表副本。

  • 这与“读时共享,写时拷贝”机制不同,后者涉及的是内存管理方面的优化

继续追问

问:

把这两点合在一起理解就是,当父进程fork了一个子进程后,子进程与父进程共享相同的内存页(也就是此时它们是真的在同一张共享文件描述符表)。只有当父进程或子进程试图修改某个内存页时,系统才会复制该内存页,为执行写入操作的进程创建一个新的物理内存页。(这个新的内存页也就是父进程内存页的一个副本,子进程拥有着这个新的内存页,这个内存页上面也有父进程文件描述符表的信息)我理解的对吗?

答:

您将两个概念联系在一起的理解有些混淆。实际上,文件描述符表与“读时共享,写时拷贝”机制是两个不同层面的概念。让我们再次澄清一下:

  • 当父进程 fork 了一个子进程后,子进程会继承父进程的文件描述符表。实际上,子进程得到的是父进程文件描述符表的一个副本,而不是共享同一个文件描述符表。这意味着子进程和父进程的文件描述符表是相互独立的,但它们指向的文件和 I/O 资源是相同的。

  • “读时共享,写时拷贝”机制是在内存管理层面进行的优化。这意味着父子进程在 fork 之后共享相同的物理内存页。只有当父进程或子进程试图修改某个内存页时,系统才会复制该内存页,为执行写入操作的进程创建一个新的物理内存页。这个过程与文件描述符表无关,涉及的是进程间内存资源的共享与复制。

  • 总之,父子进程在 fork 之后并不共享同一个文件描述符表,而是各自拥有文件描述符表的副本。这与“读时共享,写时拷贝”机制是不同的,后者涉及的是进程间内存资源的共享与复制。

再再次追问

问:

那我重新理解一下,父进程fork以后,父子进程各自拥有着各自的文件描述符的副本,但他们此时共享着同一块内存的资源。
但当发生了写入操作了以后,系统会复制一份内存的资源,然后让父子进程各自拥有着各自的内存的资源。
你看我理解的对吗?

答:

您的理解基本正确,但需要注意的是,这里的内存资源指的是物理内存页。让我们再次总结一下:

  • 当父进程 fork 一个子进程后,子进程会继承父进程的文件描述符表。实际上,子进程得到的是父进程文件描述符表的一个副本,而不是共享同一个文件描述符表。这意味着子进程和父进程的文件描述符表是相互独立的,但它们指向的文件和 I/O 资源是相同的。

  • 在 fork 之后,父子进程会共享相同的物理内存页。这是“读时共享,写时拷贝”(Copy-on-Write)机制在内存管理层面的优化。

  • 只有当父进程或子进程试图修改某个共享的物理内存页时,系统才会复制该内存页,为执行写入操作的进程创建一个新的物理内存页。这样,父子进程会各自拥有各自的内存资源。

  • 所以,您的理解是正确的。父子进程在 fork 之后各自拥有各自的文件描述符表副本,同时共享物理内存页。当发生写入操作时,系统会复制内存页,让父子进程各自拥有各自的内存资源。

最后总结

我的总结

父进程fork之后,创建出了一个子进程。此时子进程与父进程共享相同的物理内存页。子进程拥有父进程文件描述符表的一个副本。(子进程与父进程不共享文件描述符表)
如果父进程执行写入操作,系统就会创建一个新的物理内存页给父进程,然后将原来的物理内存页上的内容拷贝到这个新的物理内存页上,然后再执行写入操作。
如果子进程执行写入操作,系统就会创建一个新的物理内存页给子进程,然后将原来的物理内存页上的内容拷贝到这个新的物理内存页上,然后再执行写入操作。
你看我理解的对吗?

老师的总结

是的,您的理解是正确的。在父进程 fork 之后:

子进程和父进程共享相同的物理内存页。
子进程拥有父进程文件描述符表的一个副本,它们各自有自己独立的文件描述符表。
当父进程或子进程执行写入操作时:

系统会为执行写入操作的进程(无论是父进程还是子进程)创建一个新的物理内存页。
将原来共享的物理内存页上的内容拷贝到新的物理内存页上。
在新的物理内存页上执行写入操作。
这种优化策略被称为“读时共享,写时拷贝”(Copy-on-Write),它可以在进程间共享资源的同时,有效地节省内存和提高性能。

最最最后一个问题

问:

最后问一下,这个物理内存页都记录了哪些信息呢?

答:

物理内存页(Physical Memory Page)是计算机内存管理的基本单位。在操作系统中,物理内存被划分为固定大小的页,通常为 4KB、2MB 或更大。物理内存页用于存储各种类型的数据和信息,包括:

程序代码:程序的可执行代码通常被加载到内存中,以便 CPU 能够直接访问和执行这些指令。

数据:程序运行时所需的各种数据,包括全局变量、静态变量等,都存储在内存中。这些数据可能在程序执行过程中被读取或修改。

堆内存:堆是一个动态内存分配区域,用于存储程序运行时动态分配的内存。堆内存的大小在程序运行过程中可能会发生变化,可以通过 malloc、calloc 等函数分配内存,通过 free 函数释放内存。

栈内存:栈是程序运行时的临时存储区,用于存储函数调用过程中的局部变量、函数参数以及返回地址等信息。栈内存由编译器自动分配和回收,具有后进先出(LIFO)的特点。

其他内核数据结构:操作系统会在内存中维护一些内核相关的数据结构,如进程控制块(PCB)、文件描述符表等,这些数据结构在操作系统中起着关键作用。

总之,物理内存页存储了程序执行所需的各种信息,如代码、数据、堆内存、栈内存等。这些信息在程序运行过程中可能被多个进程共享或独占。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/210199
推荐阅读
相关标签
  

闽ICP备14008679号