赞
踩
需要云服务器等云产品来学习Linux的同学可以移步/-->腾讯云<--/-->阿里云<--/-->华为云<--/官网,轻量型云服务器低至112元/年,新用户首次下单享超低折扣。
目录
在linux中fork函数是非常重要的函数,它从已存在进程中创建一个新进程。新进程为子进程(子进程的PID是0),而原进程为父进程。
- #include <unistd.h>
- pid_t fork(void);
返回值:fork创建子进程成功后,会给父进程返回子进程的PID,给子进程返回0,失败则返回-1。
为什么要让父进程拿到子进程的PID?因为子进程变为僵尸状态后,需要父进程读取子进程的退出信息并回收资源。
操作系统将会给创建成功的子进程:
1、给子进程分配新的内存块和内核数据结构(PCB、进程地址空间、页表等,并构建对应的映射关系);
2、将父进程的部分数据结构内容拷贝至父进程;
3、把子进程添加到系统进程列表中;
4、fork返回,调度器开始调度。
在fork函数return之前,就已经有了父子两个进程,给父进程返回子进程的PID,给子进程返回0,失败则返回-1。
利用这个特性,我们可以用变量接收返回值,根据fork返回值不同让父子进程执行不同的代码。
- #include <stdio.h>
- #include <unistd.h>
- int main()
- {
- pid_t id=fork();
- if(id==0)
- {
- printf("子进程:pid=%d,ppid=%d | grobal_val=%d,&grobal_val=%p\n",getpid(),getppid(),grobal_val,&grobal_val);
- }
- else if(id>0)
- {
- printf("父进程:pid=%d,ppid=%d | grobal_val=%d,&grobal_val=%p\n",getpid(),getppid(),grobal_val,&grobal_val);
- sleep(1);
- }
- else
- {
- printf("fork error\n");
- return 1;
- }
- return 0;
- }

pid_t id=fork()这句代码父子进程谁先返回不确定。谁先返回,谁就在虚拟内存中写入id的值,后返回的进程由于进程的独立性将会发生写时拷贝。所以,我们可以看到父子进程的id变量的虚拟地址是一样的,但是内容却不一样。
系统中的进程数达到了最大限制。
- int main()
- {
- return 0;
- }
return 后面的值代表进程退出的时候,对应的退出码。标定进程执行的结果是否正确。
如果不关心一个进程的退出码,可以直接return 0;如果要关心进程的退出码,则要返回特定的数字以表明进程不同的错误。
函数原型:
- #include <string.h>
- char* strerror(int errnum);
遍历打印错误码:
- #include <stdio.h>
- #include <unistd.h>
- #include <string.h>
- int main()
- {
- for(int i=0;i<150;++i)
- {
- printf("num[%d]:%s\n",i,strerror(i));
- }
- return 0;
- }
可以看到不同的错误码对应的出错误信息。
echo $?
$?会记录最近一个进程在命令行中执行完毕时的退出码,即main函数的返回值。
正常终止(父进程获取退出码):
1、程序执行完毕,main函数返回0
2、程序执行完毕,但是返回值不为0,例如调用exit()和_exit()或return !0。
异常终止(父进程获取退出信号):
ctrl+c或除0错误等导致程序被信号终止。
函数原型:
- #include <stdlib.h>
- void exit(int status);
库函数exit在进程退出后,会主动刷新缓冲区。
函数原型:
- #include <unistd.h>
- void _exit(int status);
系统调用_exit在进程退出后,并不会主动刷新缓冲区。
子进程退出后会进入僵尸状态,父进程通过进程等待的方式,获取子进程的退出信息,回收子进程资源,让子进程结束僵尸状态。当然,在子进程没有退出时,父进程只能阻塞等待子进程变成僵尸状态。
头文件:
- #include <sys/types.h>
- #include <sys/wait.h>
函数原型:
pid_t wait(int* status);
返回值:等待成功被等待进程的pid,失败返回-1。
参数:status输出型参数,获取子进程退出码和退出状态,不关心则可以设置成为NULL。
通过wait让父进程获取子进程的PID。
- #include <stdio.h>
- #include <unistd.h>
- #include <stdlib.h>
- #include <sys/types.h>
- #include <sys/wait.h>
- int main()
- {
- pid_t id=fork();
- if(id==0)
- {
- //子进程
- int cnt=3;
- while(cnt--)
- {
- printf("子进程:%d 父进程:%d %d\n",getpid(),getppid(),cnt);
- sleep(1);
- }
- exit(0);//子进程退出
- }
- sleep(5);
- pid_t ret =wait(NULL);
- if(id>0)
- {
- //父进程
- printf("等待成功:%d\n",ret);
- }
-
- return 0;
- }

函数原型:
pid_t waitpid(pid_t pid,int* status,int options);
返回值:当正常返回的时候waitpid返回收集到的子进程的进程PID;如果设置了选项WNOHANG,而调用waitpid发现没有已退出的子进程可收集,则返回0;如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在;
参数:
PID:
PID=-1,等待任一个子进程。与wait等效。PID>0,等待进程为PID的子进程。
status:
WIFEXITED(status): 若为正常终止子进程返回的状态,则为真。(查看进程是否是正常退出)
WEXITSTATUS(status): 若WIFEXITED非零,提取子进程退出码。(查看进程的退出码)
- //WIFEXITED和WEXITSTATUS是两个宏
- if(WIFEXITED(status))//判断子进程是否正常退出(判断退出信号)
- {
- printf("exit code:%d\n",WEXITSTATUS(status));//判断子进程运行结果是否正常(判断退出码)
- }
- else{
- //something to do
- }
options:
WNOHANG: 若PID指定的子进程没有结束,则waitpid()函数返回0,不予以等待。若正常结束,则返回该子进程的PID。
- #include <stdio.h>
- #include <unistd.h>
- #include <stdlib.h>
- #include <sys/types.h>
- #include <sys/wait.h>
- int main()
- {
- pid_t id=fork();
- if(id==0)
- {
- //子进程
- int cnt=3;
- while(cnt--)
- {
- printf("子进程:%d 父进程:%d %d\n",getpid(),getppid(),cnt);
- sleep(1);
- }
- exit(10);//子进程退出
- }
- int status=0;
- pid_t ret =waitpid(id,&status,0);
- if(id>0)
- {
- //父进程
- printf("等待成功:%d,ret=%d\n",ret,status);
- }
- sleep(5);
- return 0;
- }

通过修改子进程的退出码,可以打印出不同的status值,因为status用于存储子进程的退出码和退出信号。
wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统填充。
如果传递NULL,表示不关心子进程的退出状态信息。
否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程。
status不能简单的当作整型,可以当作位图来看待。(只研究status低16比特位):
在进程退出时,终止信号是评判一个进程是否正常退出;退出状态是评判一个进程运行的结果是否正确。
1、使用kill -l来查看进程终止的信号。
2、根据退出码确定进程的退出状态。
以下代码手动调用waitpid模拟父进程等待子进程的过程:
- #include <stdio.h>
- #include <unistd.h>
- #include <stdlib.h>
- #include <sys/types.h>
- #include <sys/wait.h>
- int main()
- {
- pid_t id=fork();
- if(id==0)
- {
- //子进程
- int cnt=3;
- while(cnt--)
- {
- printf("子进程:%d 父进程:%d %d\n",getpid(),getppid(),cnt);
- sleep(1);
- }
- exit(10);//子进程退出
- }
- int status=0;
- pid_t ret =waitpid(id,&status,0);
- if(id>0)
- {
- //父进程
- printf("等待成功,返回值子进程的PID:%d,终止信号:%d,子进程退出码:%d\n",ret,(status&0X7F),((status>>8)&0XFF));
- }
- sleep(5);
- return 0;
- }

1、调用wait/waitpid后,父进程只能阻塞等待子进程变成僵尸状态。
2、子进程退出后变成僵尸状态,task_struct中的代码和数据会被释放掉,并把自己的退出信号、退出码写入到自己的task_struct中;
3、wait/waitpid是系统调用,操作系统有资格也有能力去读取子进程的task_struct。
4、父进程通过进程等待的方式,获取子进程的退出信息,回收子进程资源,让子进程结束僵尸状态。
阻塞式等待:当父进程调用wait/waitpid(第三个参数为0)等待子进程,如果子进程暂未退出,父进程会被阻塞,暂停运行,如果父进程刚好没事干,可以选择使用阻塞等待。
非阻塞式等待:当父进程调用waitpid(第三个参数为WNOHANG)等待子进程,如果父进程检测到子进程未退出,父进程并不会原地等待,而是继续执行自己的代码。如果使用while循环,便能达到轮询的效果。
非阻塞式等待不会占用父进程的精力,父进程可以在轮询的过程中做其他事情:
- #include <stdio.h>
- #include <stdlib.h>
- #include <unistd.h>
- #include <string.h>
- #include <sys/types.h>
- #include <sys/wait.h>
- #include <assert.h>
-
- #define NUM 5
- typedef void (*func_t)(); //函数指针
- func_t handlerTask[NUM];//函数指针数组
-
- //任务
- void task1()
- {
- printf("handler task1\n");
- }
- void task2()
- {
- printf("handler task2\n");
- }
- void task3()
- {
- printf("handler task3\n");
- }
-
- void loadTask()
- {
- memset(handlerTask, 0, sizeof(handlerTask));//将函数指针数组初始化为0
- handlerTask[0] = task1;//函数指针数组handlerTask[0]存放task1的地址
- handlerTask[1] = task2;
- handlerTask[2] = task3;
- }
- int main()
- {
- pid_t id = fork();
- assert(id != -1);
- if(id == 0)
- {
- //child
- int cnt = 10;
- while(cnt)
- {
- printf("child running, pid: %d, ppid: %d, cnt: %d\n", getpid(), getppid(), cnt--);
- sleep(1);
- }
- exit(10);
- }
- loadTask();//加载任务
- // parent
- int status = 0;
- while(1)//父进程对子进程状态轮询
- {
- pid_t ret = waitpid(id, &status, WNOHANG);//第三个参数为0表示阻塞式等待,为WNOHANG表示非阻塞式等待
- if(ret == 0)//等于0代表没有被等待的进程暂未退出
- {
- printf("wait done, but child is running...., parent running other things\n");
- for(int i = 0; handlerTask[i] != NULL; i++)//遍历到NULL,即0停止
- {
- handlerTask[i](); //采用回调的方式,执行我们想让父进程在空闲的时候做的事情
- }
- }
- else if(ret > 0)//waitpid调用成功,并且子进程退出,返回值为被等待子进程的pid
- {
- printf("wait success, exit code: %d, sig: %d\n", (status>>8)&0xFF, status & 0x7F);
- break;
- }
- else//等于-1表示等待失败,waitpid中的第一个参数值传错会导致调用失败
- {
- printf("waitpid call failed\n");
- break;
- }
- sleep(1);
- }
- return 0;
- }

将磁盘中指定的程序加载到内存中,让指定的进程进行执行。不论是何种后端语言写的程序,exec*函数都可以调用。
替换函数:
- #include <unistd.h>`
- //execve的封装
- int execl(const char *path, const char *arg, ...);
- int execlp(const char *file, const char *arg, ...);
- int execle(const char *path, const char *arg, ...,char *const envp[]);
- int execv(const char *path, char *const argv[]);
- int execvp(const char *file, char *const argv[]);
- int execvpe(const char *file, char *const argv[],char *const envp[]);
- //系统调用
- int execve(const char *filename, char *const argv[],char *const envp[]);
l(list) : 表示参数采用列表 ;
p(path) : 带p,不用传入地址,传入可执行程序的名字即可,它会自动去环境变量PATH中寻找该可执行程序的地址;
v(vector) :执行参数放入数组中,统一传递;
e(env) : 可以传入自己写的环境变量。
1、通过execl函数调用ls命令:
- #include <stdio.h>
- #include <unistd.h>
- int main()
- {
- printf("process is running·····\n");
- execl("/usr/bin/ls"/*要执行的程序*/,"ls","--color=auto","-a","-l",NULL/*如何执行*/);//一定要用NULL结尾
- printf("process is down·····\n");//这句话并不会被打印,因为后续代码和数据已经被execl函数替换了
- return 0;
- }
如果调用execl函数,参数传错导致函数调用失败,后续代码将不会被覆盖。
2、通过execle函数调用外部程序并使用自定义环境变量:
- #include <stdio.h>
- #include <unistd.h>
- int main()
- {
- printf("process is running··\n");
- //使用自定义的环境变量
- //char* const _env[]={(char*)"MYENV=12345",NULL};
- //execle("./mybin","mybin",NULL,_env);
-
- //使用系统的环境变量
- //extern char** environ;
- //execle("./mybin","mybin",NULL,environ);//系统环境变量不传,进程也能获取
-
- //使用putenv将自己的环境变量导入到environ指向的环境变量表中
- extern char** environ;
- char* const _env[]={(char*)"MYENV=12345",NULL};
- putenv((char*)"MYENV=654321");
- execle("./mybin","mybin",NULL,environ);
- printf("process is running··\n");
- return 0;
- }

程序替换的本质:用磁盘指定位置上的程序的代码和数据,覆盖进程自身的代码和数据,达到让进程执行指定程序的目的。
exec()函数仅在发生错误时返回。返回值为-1,设置errno以指示错误。
可以看到exec*系列函数调用成功后并没有返回值,因为exec*一旦被调用成功,后续代码将被覆盖,根本没机会用到返回值。
- #include <stdio.h>
- #include <stdlib.h>
- #include <unistd.h>
- #include <sys/types.h>
- #include <sys/wait.h>
- #include <assert.h>
- #include <string.h>
- #define NUM 100
- #define OPT_NUM 20
- char LineCommand[NUM];
- char* myargv[OPT_NUM];//指针数组,用于记录切割出来的字符串
- int lastCode = 0;
- int lastSig = 0;
- int main()
- {
- while(1)
- {
- printf("用户名@主机名 当前路径:");
- fflush(stdout);
- //获取输入内容
- char* s=fgets(LineCommand,sizeof(LineCommand),stdin);
- assert(s!=NULL);
- //清除最后一个\n
- LineCommand[strlen(LineCommand)-1]=0;
- //字符串切割
- myargv[0]=strtok(s," ");
- int i=1;
- if(myargv[0]!=NULL&&strcmp(myargv[0],"ls")==0)//判断myargv[0]是否切割正常,穷举指令,为指令添加选项
- {
- myargv[i++]=(char*)"--color=auto";
- }
- while(myargv[i++]=strtok(NULL," "));//如果切割完毕,strtok会返回NULL,刚好myargv[end]需要等于NULL
- if(myargv[0]!=NULL&&strcmp(myargv[0],"cd")==0)//解决cd命令返回的是子进程的上级目录问题
- {
- if(myargv[1]!=NULL)
- {
- chdir(myargv[1]);//使用chdir()改变父进程的当前路径
- continue;//如果改变路径,就continue跳出本轮循环,后续子进程可以不用创建
- }
- }
- if(myargv[0] != NULL && myargv[1] != NULL && strcmp(myargv[0], "echo") == 0)
- {
- if(strcmp(myargv[1], "$?") == 0)
- {
- printf("%d, %d\n", lastCode, lastSig);
- }
- else
- {
- printf("%s\n", myargv[1]);
- }
- continue;
- }
- //测试是否成功
- #ifdef DEBUG
- for(i=0;myargv[i];++i)
- {
- printf("myargv[%d]:%s\n",i,myargv[i]);
- }
- #endif
- //执行命令
- pid_t id=fork();//创建子进程,让子进程去执行被切割出来的指令
- assert(id!=-1);
- if(id==0)
- {
- execvp(myargv[0],myargv);
- exit(1);
- }
- int status = 0;
- pid_t ret = waitpid(id, &status, 0);
- assert(ret > 0);
- (void)ret;
- lastCode = ((status>>8) & 0xFF);
- lastSig = (status & 0x7F);
- }
- return 0;
- }

运行该程序,可以实现shell的效果,如果33行-40行逻辑如果不写,使用cd ..指令回到上级目录时,发现我们在原地TP。
原因:因为这个"模拟shell"程序会使用fork()创建子进程执行指令,当使用cd ..时,回到的是子进程的上级目录,不会改变父进程的当前工作目录。可以额外判断一下cd命令,如果是cd命令,使用chdir改变父进程的工作目录,continue跳出本轮循环。(无需创建后续子进程)
像这种不需要子进程来执行,而是让shell来执行的命令叫做内建/内置命令。这也解释了为什么echo能打印本地环境变量,因为echo也是一个内建命令,由shell执行,shell当然能打印本地环境变量。
查看进程当前目录:
可以使用chdir()更改进程的当前目录。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。