赞
踩
编写以下程序并运行:
- #include <stdio.h>
- #include <unistd.h>
-
- int main()
- {
- while (1){
- printf("hello signal!\n");
- sleep(1);
- }
- return 0;
- }
我们知道该程序的运行结果就是死循环地进行打印,而对于死循环来说,最好的方式就是使用Ctrl+C对其进行终止
为什么使用Ctrl+C后,该进程就终止了?
实际上当用户按下Ctrl+C时,这个键盘输入会产生一个硬中断,被操作系统获取并解释成信号(ctrl+c被解释成2号信号),然后操作系统将2号信号发送给目标前台进程,当前台进程收到2号信号就会退出。
我们可以使用signal函数对2号进行捕捉,证明当我们按ctrl+c时进程确实是收到了2号信号。使用signal函数时,我们需要传入两个参数,第一个需要捕捉得信号编号,第二个是对捕捉信号的处理方法,该处理方法的参数是int,返回值是viod。
例如,下面的代码中将2号信号进行了捕捉,当该进程运行起来后,若该进程收到了2号信号就会打印出收到信号的信号编号。
- #include <stdio.h>
- #include <signal.h>
- #include <unistd.h>
-
- void handler(int sig)
- {
- printf("get a signal:%d\n", sig);
- }
-
- int main()
- {
- signal(2, handler); //注册2号信号
- while (1){
- printf("hello signal!\n");
- sleep(1);
- }
- return 0;
- }
此时当该进程收到2号信号后,就会执行我们给出的handler方法,而不会像之前一样直接退出了,因为此时我们已经将2号信号的处理方式由默认改为了自定义了。
注意:
使用kill -l命令可以查看Linux当中的信号列表。
其中1~31号信号是普通信号,34~64号信号是实时信号,普通信号和实时信号各自都有31个,每个信号都有一个编号和一个宏定义名称
信号是如何记录的?
实际上,当一个进程接收到某种信号后,该信号是被记录在该进程的进程控制块当中的。我们都知道进程控制块本质上就是一个结构体变量,而对于信号来说我们主要就是记录某种信号是否产生,因此我们可以用一个32位的位图来记录信号是否产生。
其中比特位的位置代表信号的编号,而比特位的内容就代表是否受到该对应信号,比如第6个比特位是1个就表明收到了6号信号。
信号是如何产生的?
一个进程收到信号,本质就是该进程内的信号位图被修改了,也就是该进程的数据被修改了,而只有操作系统才有资格修改进程的数据,因为操作系统是进程的管理者。也就说,信号的产生本质上就是操作系统直接去修改目标进程的task_struct中的信号位图。
注意:信号只能由操作系统发送,但信号发送的方式有多种。
在Linux中,我们可以通过man手册查看各个信号默认的处理动作。
man 7 signal
当面对下面的死循环程序时,我们都知道可以按Ctrl+C可以终止该进程。
- #include <stdio.h>
- #include <unistd.h>
-
- int main()
- {
- while (1){
- printf("hello signal!\n");
- sleep(1);
- }
- return 0;
- }
但实际上除了按Ctrl+C之外,按Ctrl+\也可以终止该进程。
按Ctrl+C终止进程和按Ctrl+\终止进程,有什么区别?
按Ctrl+C实际上是向进程发送2号信号SIGINT,而按ctrl+\实际上是向进程发送3号信号SIGQUIT。查看这两个信号的默认处理动作,可以看到这两个信号的action是不一样的,2号信号是term,而三号信号是core.
Term和Core都代表着终止进程,但是Core在终止进程的时候会进行一个动作,那就是核心转储。
什么是核心转储?
在云服务器中,核心转储是默认被关掉的,我们可以通过使用ulimit -a命令查看当前资源限制的设定。
其中,第一行显示core文件的大小为0,即表示核心转储是被关闭的。
我们可以通过 ulimit -c size
命令来设置core文件的大小。
core文件的大小设置完毕后,就相当于将核心转储功能打开了。此时如果我们再使用Ctrl+\对进程进行终止,就会发现终止进程后会显示core dumped
。
并且会在当前路径下生成一个core文件,该文件以一串数字为后缀,而这一串数字实际上就是发生这一次核心转储的进程的PID。
说明以下:ulimit命令改变的是shell进程的resource limit,但myproc进程的PCB是由shell进程复制而来的,所以也具有和shell进程相同的resource limit值。
核心转储功能有什么用?
当我们代码出错了,我们最关心的是我们的代码是什么原因出错的。如果我们的代码运行结束了,那么我们可以通过退出码来判断代码出错的原因,而如果一个代码是在运行过程中出错的,那么我们也要有办法判断代码是什么原因出错的。
当我们的程序在运行过程中崩溃了,我们一般会通过调试来进行逐步查找程序崩溃的原因。而在某些特殊情况下,我们会用到核心转储,核心转储指的是操作系统在进程收到某些信号而终止运行时,将该进程地址空间的内容以及有关进程状态的其他信息转而存储到一个磁盘文件当中,这个磁盘文件也叫做核心转储文件,一般命名位core.pid
而核心转储的目的就是为了在调试时,方便问题的定位。
如何运用核心转储进行调试?
我们用下面这段代码进行演示
很明显,该代码当中出现了除0错误,该程序运行3秒后便会崩溃
此时我们便可以在当前目录下看到核心转储时生成的core文件。
此时使用gdb对当前可执行程序进行调试,然后直接使用core-file core文件
命令加载core文件,即可判断出该程序在终止时收到了8号信号,并且定位到了产生该错误的具体代码。
事后用调试器检查core文件以查清错误原因,这种调试方式叫做事后调试
core dump标志
还记得进程等待函数waitpid函数的第二个参数马:
pid_t waitpid(pid_t pid, int *status, int options);
waitpid函数的第二个参数status是一个输出型参数,用于获取子进程的退出状态。status是一个整型变量,但status不能简单的当作整型来看待,status的不同比特位所代表的信息不同,具体细节如下(只关注status低16位比特位):
若进程是正常终止,那么status的次低8位就表示进程的退出状态,即退出码。若进程是被信号所杀,那么status的低7位表示终止信号,而第8比特位是core dump标志,即进程终止是否进行了核心转储。
打开Linux的核心转储功能,并编写下列代码。代码中父进程使用fork函数创建一个子进程,子进程所执行的代码当中存在野指针问题,当子进程执行*p=100时,必然会被操作系统所终止并在终止时进行核心转储。此时父进程使用waitpid函数便可获取到子进程退出时的状态,根据status的第7个比特位便可得知子进程的被终止时是否进行了核心转储。
- #include <stdio.h>
- #include <stdlib.h>
- #include <unistd.h>
- #include <sys/wait.h>
- #include <sys/types.h>
-
- int main()
- {
- if (fork() == 0){
- //child
- printf("I am running...\n");
- int *p = NULL;
- *p = 100;
- exit(0);
- }
- //father
- int status = 0;
- waitpid(-1, &status, 0);
- printf("exitCode:%d, coreDump:%d, signal:%d\n",
- (status >> 8) & 0xff, (status >> 7) & 1, status & 0x7f);
- return 0;
- }
可以看到,所获取的status的第7个比特位为1,即可说明子进程在被终止时进行了核心转储。
因此,core dump标志实际上就是用于表示程序崩溃的时候是否进行了核心转储。
其他组合按键?
我们可以通过以下代码,将1~31号信号全部进行捕捉,将收到信号后的默认处理动作改为打印收到信号的编号。
- #include <stdio.h>
- #include <unistd.h>
- #include <signal.h>
-
- void handler(int signal)
- {
- printf("get a signal:%d\n", signal);
- }
- int main()
- {
- int signo;
- for (signo = 1; signo <= 31; signo++){
- signal(signo, handler);
- }
- while (1){
- sleep(1);
- }
- return 0;
- }
此时,当我们按下组合按键Ctrl+C、Ctrl+\、Ctrl+Z后,便可以得知这些组合按键分别是向前台进程发送几号信号了。
但如果我们此时向该进程发送9号信号,该进程并不会打印收到了9号信号,而是执行收到9号信号后的默认处理动作,即被终止
说明: 有些信号是不能被捕捉的,比如9号信号。因为如果所有信号都能被捕捉的话,那么进程就可以将所有信号全部进行捕捉并将动作设置为忽略,此时该进程将无法被杀死,即便是操作系统。
当我们要使用kill命令向一个进程发送信号时,我们可以以kill -信号名 进程ID
的形式进行发送。
也可以以kill -信号编号 进程ID
的形式进行发送。
Kill函数
实际上kill命令是通过调用kill函数实现的,kill函数可以给指定的进程发送指定的信号,kill函数的函数原型如下:
int kill(pid_t pid, int sig);
kill函数用于向进程ID为pid
的进程发送sig
号信号,如果信号发送成功,则返回0,否则返回-1。
我们可以用kill函数模拟实现一个kill命令,实现逻辑如下:
- #include <stdio.h>
- #include <stdlib.h>
- #include <sys/types.h>
- #include <signal.h>
-
- void Usage(char* proc)
- {
- printf("Usage: %s pid signo\n", proc);
- }
- int main(int argc, char* argv[])
- {
- if (argc != 3){
- Usage(argv[0]);
- return 1;
- }
- pid_t pid = atoi(argv[1]);
- int signo = atoi(argv[2]);
- kill(pid, signo);
- return 0;
- }
为了让生成的可执行程序在执行时不用带上路径,我们可以将当前路径导入环境变量PATH当中。
这里不推荐使用,知道就可以了,使用当前路径即可。
此时我们便模拟实现了一个kill命令,该命令的使用方式为mykill 进程ID 信号编号
。
raise函数
raise函数可以给当前进程发送指定信号,即自己给自己发送信号,raise函数的函数原型如下:
int raise(int sig);
raise函数用于给当前进程发送sig号信号,如果信号发送成功,则返回0,否则返回一个非零值。
例如,下列代码当中用raise函数每隔一秒向自己发送一个2号信号
- #include <stdio.h>
- #include <unistd.h>
- #include <signal.h>
-
- void handler(int signo)
- {
- printf("get a signal:%d\n", signo);
- }
- int main()
- {
- signal(2, handler);
- while (1){
- sleep(1);
- raise(2);
- }
- return 0;
- }
运行结果如下:
abort函数
abort函数可以给当前进程发送SIGABRT信号,使得当前进程异常终止,abort函数的函数原型如下:
void abort(void);
abort函数是一个无参数无返回值的函数
例如,下列代码当中每隔一秒向当前进程发送一个SIGABRT信号
- #include <stdio.h>
- #include <stdlib.h>
- #include <unistd.h>
- #include <signal.h>
-
- void handler(int signo)
- {
- printf("get a signal:%d\n", signo);
- }
- int main()
- {
- signal(6, handler);
- while (1){
- sleep(1);
- abort();
- }
- return 0;
- }
与之前不同的是,虽然我们对SIGABRT信号进行了捕捉,并且在收到SIGABRT信号后执行了我们给出的自定义方法,但是当前进程依然是异常终止了。
abort函数的作用是异常终止进程,exit函数的作用是正常终止进程,而abort本质是通过向当前进程发送SIGABRT信号而终止进程的,因此使用exit函数终止进程可能会失败,但使用abort函数终止进程总会成功。
SIGPIPE信号
SIGPIPE信号实际上就是一种由软件条件产生的信号,当进程在使用管道进行通信时,读端进程将读端关闭,而写端进程还在一直向管道写入数据,那么此时写端进程就会收到SIGPIPE信号进而被操作系统终止。
例如,下面代码当中,创建匿名管道进行父子进程之间的通信,其中父进程是读端进程,子进程是写端进程,但是一开始通信父进程就将读端关闭,那么此时子进程向管道写入数据时就会收到SIGPIPE信号,进而被终止。
- #include <stdio.h>
- #include <unistd.h>
- #include <string.h>
- #include <stdlib.h>
- #include <sys/types.h>
- #include <sys/wait.h>
- int main()
- {
- int fd[2] = { 0 };
- if (pipe(fd) < 0){ //使用pipe创建匿名管道
- perror("pipe");
- return 1;
- }
- pid_t id = fork(); //使用fork创建子进程
- if (id == 0){
- //child
- close(fd[0]); //子进程关闭读端
- //子进程向管道写入数据
- const char* msg = "hello father, I am child...";
- int count = 10;
- while (count--){
- write(fd[1], msg, strlen(msg));
- sleep(1);
- }
- close(fd[1]); //子进程写入完毕,关闭文件
- exit(0);
- }
- //father
- close(fd[1]); //父进程关闭写端
- close(fd[0]); //父进程直接关闭读端(导致子进程被操作系统杀掉)
- int status = 0;
- waitpid(id, &status, 0);
- printf("child get signal:%d\n", status & 0x7F); //打印子进程收到的信号
- return 0;
- }
运行代码后,即可发现子进程在退出时收到的是13号信号,即SIGPIPE信号
SIGALRM信号
调用alarm函数可以设定一个闹钟,也就是告诉操作系统在若干时间后发送SIGALRM信号给当前进程,alarm函数的函数原型如下:
unsigned int alarm(unsigned int seconds);
alarm函数的作用就是,让操作系统在seconds秒之后给当前进程发送SIGALRM信号,SIGALRM信号的默认处理动作是终止进程。
alarm函数的返回值:
例如,我们可以用下面的代码,测试自己的云服务器一秒时间内可以将一个变量累加到多大。
- #include <stdio.h>
- #include <signal.h>
- #include <unistd.h>
-
- int main()
- {
- int count = 0;
- alarm(1);
- while (1){
- count++;
- printf("count: %d\n", count);
- }
- return 0;
- }
运行代码后,可以发现我当前的云服务器在一秒内可以将一个变量累加到13万左右。
但实际上我当前的云服务器在一秒内可以执行的累加次数远大于13万,那为什么上述代码运行结果比实际结果要小呢?
主要原因有两个,首先,由于我们每进行一次累加就进行了一次打印操作,而与外设之间的IO操作所需的时间要比累加操作的时间更长,其次,由于我当前使用云服务器,因此在累加操作后还需要将累加结果通过网络传输将服务器上的数据发送过来,因此最终显示的结果要比实际一秒内累加的次数小得多。
为了尽可能避免上述问题,我们可以先让count变量一直执行累加操作,直到一秒后进程收到SIGALRM信号后再打印累加后的数据。
- #include <stdio.h>
- #include <stdlib.h>
- #include <signal.h>
- #include <unistd.h>
-
- int count = 0;
- void handler(int signo)
- {
- printf("get a signal: %d\n", signo);
- printf("count: %d\n", count);
- exit(1);
- }
- int main()
- {
- signal(SIGALRM, handler);
- alarm(1);
- while (1){
- count++;
- }
- return 0;
- }
此时可以看到,count变量在一秒内被累加的次数变成了五亿多,由此也证明了,与计算机单纯的计算相比较,计算机与外设进行IO时的速度是非常慢的。
为什么C/C++程序会崩溃?
当我们程序当中出现类似于除0、野指针、越界之类的错误时,为什么程序会崩溃?本质上是因为进程在运行过程中收到了操作系统发来的信号进而被终止,那操作系统是如何识别到一个进程触发了某种问题的呢?
CPU当中有一堆的寄存器,当我们需要对两个数进行算术运算时,我们是先将这两个操作数分别放到两个寄存器当中,然后进行算术运算并把结果写回寄存器当中。此外,CPU当中还有一组寄存器叫做状态寄存器,它可以用来标记当前指令执行结果的各种状态信息,如有无进位、有无溢出等等。而操作系统是软硬件资源的管理者,在程序运行过程中,若操作系统发现CPU内的某个状态标志位被置位,而这次置位就是因为出现了某种除0错误而导致的,那么此时操作系统就会马上识别到当前是哪个进程导致的该错误,并将所识别到的硬件错误包装成信号发送给目标进程,本质就是操作系统去直接找到这个进程的task_struct,并向该进程的位图中写入8信号,写入8号信号后这个进程就会在合适的时候被终止。
那对于下面的野指针问题,或者越界访问的问题时,操作系统又是如何识别到的呢?
运行结果
首先我们必须知道的是,当我们要访问一个变量时,一定要先经过页表的映射,将虚拟地址转换成物理地址,然后才能进行相应的访问操作。
其中页表属于一种软件映射关系,而实际上在从虚拟地址到物理地址映射的时候还有一个硬件叫做MMU,它是一种负责处理CPU的内存访问请求的计算机硬件,因此映射工作不是由CPU做的,而是由MMU做的,但现在MMU已经集成到CPU当中了。
当需要进行虚拟地址到物理地址的映射时,我们先将页表的左侧的虚拟地址导出给MMU,然后MMU会计算出对应的物理地址,我们再通过这个物理地址进行相应都得访问。
而MMU既然是硬件单元,那么它当然也有相应的状态信息,当我们要访问不属于我们的虚拟地址时,MMU在进行虚拟地址到物理地址的转换时就会出现错误,然后将对应的错误写入到自己的状态信息当中,这时硬件上面的信息也会立马被操作系统识别到,进而将对应进程发送SIGSEGV信号。
C/C++程序会崩溃,是因为程序当中出现的各种错误最终一定会在硬件层面上有所表现,进而会被操作系统识别到,然后操作系统就会发送相应的信号将当前的进程终止。
信号在内核中的表示示意图如下:
总结一下:
1.在block位图中,比特位的位置代表某一个信号,比特位的内容代表该信号是否被阻塞。
2.在pending位图中,比特位的位置代表某一个信号,比特位的内容代表是否收到该信号。
3.handler表本质上是一个函数指针数组,数组的下标代表某一个信号,数组的内容代表该信号递达时的处理动作,处理动作包括默认、忽略以及自定义。
4.block、pending和handler这三张表的每一个位置是一一对应的。
根据信号在内核中的表示方法,每个信号的未决标志只有一个比特位,非0即1,如果不记录该信号产生了多少次,那么阻塞标志也只有一个比特位。
因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储。在我当前的云服务中,sigset_t类型的定义如下:(不同操作系统实现sigset_t的方案可能不同)
- #define _SIGSET_NWORDS (1024 / (8 * sizeof (unsigned long int)))
- typedef struct
- {
- unsigned long int __val[_SIGSET_NWORDS];
- } __sigset_t;
-
- typedef __sigset_t sigset_t;
sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态。
阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略。
sigset_t类型对于每种信号用一个bit表示“有效”或“无效”,至于这个类型内部如何存储这些bit则依赖于系统的实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t变量是没有意义的。
- #include <signal.h>
-
- int sigemptyset(sigset_t *set);
-
- int sigfillset(sigset_t *set);
-
- int sigaddset(sigset_t *set, int signum);
-
- int sigdelset(sigset_t *set, int signum);
-
- int sigismember(const sigset_t *set, int signum);
函数解释:
注意: 在使用sigset_t类型的变量之前,一定要调用sigemptyset或sigfillset做初始化,使信号处于确定的状态。
例如,我们可以按照如下方式使用这些函数。
- #include <stdio.h>
- #include <signal.h>
-
- int main()
- {
- sigset_t s; //用户空间定义的变量
-
- sigemptyset(&s);
-
- sigfillset(&s);
-
- sigaddset(&s, SIGINT);
-
- sigdelset(&s, SIGINT);
-
- sigismember(&s, SIGINT);
- return 0;
- }
注意: 代码中定义的sigset_t类型的变量s,与我们平常定义的变量一样都是在用户空间定义的变量,所以后面我们用信号集操作函数对变量s的操作实际上只是对用户空间的变量s做了修改,并不会影响进程的任何行为。因此,我们还需要通过系统调用,才能将变量s的数据设置进操作系统。
sigprocmask函数可以用于读取或更改进程的信号屏蔽字(阻塞信号集),该函数的函数原型如下:
int sigprocmask(int how, const sigset_t *set, sigset_t *oldset);
参数说明:
假设当前的信号屏蔽字为mask,下表说明了how参数的可选值及其含义:
选项 | 含义 | |
SIG_BLOCK | set包含了我们希望添加到当前信号屏蔽字的信号,相当于mask=mask|set | |
| set包含了我们希望从当前信号屏蔽字中解除阻塞的信号,相当于mask=mask|~set | |
SIG_SETMASK | 设置当前信号屏蔽字为set所指向的值,相当于mask=set |
返回值说明:
注意: 如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask函数返回前,至少将其中一个信号递达。
实例:
运行结果:屏蔽了2的信号,发现键盘输入ctrl+c,不会终止进程。
注意:不是所有的信号都可以屏蔽的,例如9信号就不可以。
sigpending函数可以用于读取进程的未决信号集,该函数的函数原型如下:
int sigpending(sigset_t *set);
sigpending函数读取当前进程的未决信号集,并通过set参数传出。该函数调用成功返回0,出错返回-1。
下面来做一个实验
代码如下:
- #include <stdio.h>
- #include <unistd.h>
- #include <signal.h>
-
- void printPending(sigset_t *pending)
- {
- int i = 1;
- for (i = 1; i <= 31; i++){
- if (sigismember(pending, i)){
- printf("1 ");
- }
- else{
- printf("0 ");
- }
- }
- printf("\n");
- }
- int main()
- {
- sigset_t set, oset;
- sigemptyset(&set);
- sigemptyset(&oset);
-
- sigaddset(&set, 2); //SIGINT
- sigprocmask(SIG_SETMASK, &set, &oset); //阻塞2号信号
-
- sigset_t pending;
- sigemptyset(&pending);
-
- while (1){
- sigpending(&pending); //获取pending
- printPending(&pending); //打印pending位图(1表示未决)
- sleep(1);
- }
- return 0;
- }
可以看到,程序刚刚运行时,因为没有收到任何信号,所以此时该进程的pending表一直是全0,而当我们使用kill命令向该进程发送2号信号后,由于2号信号是阻塞的,因此2号信号一直处于未决状态,所以我们看到pending表中的第二个数字一直是1。
为了看到2号信号递达后pending表的变化,我们可以设置一段时间后,自动解除2号信号的阻塞状态,解除2号信号的阻塞状态后2号信号就会立即被递达。因为2号信号的默认处理动作是终止进程,所以为了看到2号信号递达后的pending表,我们可以将2号信号进行捕捉,让2号信号递达时执行我们所给的自定义动作。
- #include <stdio.h>
- #include <unistd.h>
- #include <signal.h>
-
- void printPending(sigset_t *pending)
- {
- int i = 1;
- for (i = 1; i <= 31; i++){
- if (sigismember(pending, i)){
- printf("1 ");
- }
- else{
- printf("0 ");
- }
- }
- printf("\n");
- }
- void handler(int signo)
- {
- printf("handler signo:%d\n", signo);
- }
- int main()
- {
- signal(2, handler);
- sigset_t set, oset;
- sigemptyset(&set);
- sigemptyset(&oset);
-
- sigaddset(&set, 2); //SIGINT
- sigprocmask(SIG_SETMASK, &set, &oset); //阻塞2号信号
-
- sigset_t pending;
- sigemptyset(&pending);
-
- int count = 0;
- while (1){
- sigpending(&pending); //获取pending
- printPending(&pending); //打印pending位图(1表示未决)
- sleep(1);
- count++;
- if (count == 20){
- sigprocmask(SIG_SETMASK, &oset, NULL); //恢复曾经的信号屏蔽字
- printf("恢复信号屏蔽字\n");
- }
- }
- return 0;
- }
此时就可以看到,进程收到2号信号后,该信号在一段时间内处于未决状态,当解除2号信号的屏蔽后,2号信号就会立即递达,执行我们所给的自定义动作,而此时的pending表也变回了全0。
细节: 在解除2号信号后,2号信号的自定义动作是在打印“恢复信号屏蔽字”之前执行的。因为如果调用sigprocmask解除对当前若干个未决信号的阻塞,则在sigprocmask函数返回前,至少将其中一个信号递达。
每一个进程都有自己的进程地址空间,该进程地址空间由内核空间和用户空间组成:
内核级页表是一个全局的页表,它用来维护操作系统的代码与进程之间的关系。因此,在每个进程的进程地址空间中,用户空间属于当前进程的,每个进程看到的代码和数据是完全不同的,但内核空间所存在的都是操作系统的代码和数据,所有进程看到的都是一样的内容。
需要注意的是,虽然每个进程都能够看到操作系统,但并不意味着每个进程都能够随时对其进行访问。
如何理解进程切换?
注意: 当你访问用户空间时你必须处于用户态,当你访问内核空间时你必须处于内核态。
内核态与用户态:
进程收到信号之后,并不是立即处理信号,而是在合适的时候,这里所说的合适的时候实际上就是指,从内核态切换回用户态的时候。
内核态和用户态之间是进行如何切换的?
从用户态切换为内核态通常有如下几种情况:
与之相对应,从内核态切换为用户态有如下几种情况:
其中,由用户态切换为内核态我们称之为陷入内核。每当我们需要陷入内核的时,本质上是因为我们需要执行操作系统的代码,比如系统调用函数是由操作系统实现的,我们要进行系统调用就必须先由用户态切换为内核态。
当我们在执行主控制流程的时候,可能因为某些情况而陷入内核,当内核处理完毕准备返回用户态时,就需要进行信号pending的检查。(此时仍处于内核态,有权力查看当前进程的pending位图)
在查看pending位图时,如果发现有未决信号,并且该信号没有被阻塞,那么此时就需要该信号进行处理。
如果待处理信号的处理动作是默认或者忽略,则执行该信号的处理动作后清除对应的pending标志位,如果没有新的信号要递达,就直接返回用户态,从主控制流程中上次被中断的地方继续向下执行即可。
但如果待处理信号是自定义捕捉的,即该信号的处理动作是由用户提供的,那么处理该信号时就需要先返回用户态执行对应的自定义处理动作,执行完后再通过特殊的系统调用sigreturn再次陷入内核并清除对应的pending标志位,如果没有新的信号要递达,就直接返回用户态,继续执行主控制流程的代码。
注意: sighandler和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是两个独立的控制流程。
巧记
当待处理信号是自定义捕捉时的情况比较复杂,可以借助下图进行记忆:
其中,该图形与直线有几个交点就代表在这期间有几次状态切换,而箭头的方向就代表着此次状态切换的方向,图形中间的圆点就代表着检查pending表。
当识别到信号的处理动作是自定义时,能直接在内核态执行用户空间的代码吗?
理论上来说是可以的,因为内核态是一种权限非常高的状态,但是绝对不能这样设计。
如果允许在内核态直接执行用户空间的代码,那么用户就可以在代码中设计一些非法操作,比如清空数据库等,虽然在用户态时没有足够的权限做到清空数据库,但是如果是在内核态时执行了这种非法代码,那么数据库就真的被清空了,因为内核态是有足够权限清空数据库的。
也就是说,不能让操作系统直接去执行用户的代码,因为操作系统无法保证用户的代码是合法代码,即操作系统不信任任何用户。
捕捉信号除了用前面用过的signal函数之外,我们还可以使用sigaction函数对信号进行捕捉,sigaction函数的函数原型如下:
int sigaction(int signum, const struct sigaction *act, struct sigaction *oldact);
sigaction函数可以读取和修改与指定信号相关联的处理动作,该函数调用成功返回0,出错返回-1
参数说明:
其中,参数act和oldact都是结构体指针变量,该结构体的定义如下:
- struct sigaction {
- void(*sa_handler)(int);
- void(*sa_sigaction)(int, siginfo_t *, void *);
- sigset_t sa_mask;
- int sa_flags;
- void(*sa_restorer)(void);
- };
结构体的第一个成员sa_handler:
注意: 所注册的信号处理函数的返回值为void,参数为int,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然这是一个回调函数,不是被main函数调用,而是被系统所调用。
结构体的第二个成员sa_sigaction:
结构体的第三个成员sa_mask:
首先需要说明的是,当某个信号的处理函数被调用,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。
如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时,自动恢复原来的信号屏蔽字。
结构体的第四个成员sa_flags:
sa_flags字段包含一些选项,这里直接将sa_flags设置为0即可
结构体的第五个成员sa_restorer:
该参数没有使用。
例如,下面我们用sigaction函数对2号信号进行了捕捉,将2号信号的处理动作改为了自定义的打印动作,并在执行一次自定义动作后将2号信号的处理动作恢复为原来默认的处理动作。
- #include <stdio.h>
- #include <string.h>
- #include <unistd.h>
- #include <signal.h>
-
- struct sigaction act, oact;
- void handler(int signo)
- {
- printf("get a signal:%d\n", signo);
- sigaction(2, &oact, NULL);
- }
- int main()
- {
- memset(&act, 0, sizeof(act));
- memset(&oact, 0, sizeof(oact));
-
- act.sa_handler = handler;
- act.sa_flags = 0;
- sigemptyset(&act.sa_mask);
-
- sigaction(2, &act, &oact);
- while (1){
- printf("I am a process...\n");
- sleep(1);
- }
- return 0;
- }
运行代码后,第一次向进程发送2号信号,执行我们自定义的打印动作,当我们再次向进程发送2号信号,就执行该信号的默认处理动作了,即终止进程
下面主函数中调用insert函数向链表中插入结点node1,某信号处理函数中也调用了insert函数向链表中插入结点node2,乍眼一看好像没什么问题。
下面我们来分析一下,对于下面这个链表。
1、首先,main函数中调用了insert函数,想将结点node1插入链表,但插入操作分为两步,刚做完第一步的时候,因为硬件中断使进程切换到内核,再次回到用户态之前检查到有信号待处理,于是切换到sighandler函数。
2、而sighandler函数中也调用了insert函数,将结点node2插入到了链表中,插入操作完成第一步后的情况如下:
3、当结点node2插入的两步操作都做完之后从sighandler返回内核态,此时链表的布局如下:
4、再次回到用户态就从main函数调用的insert函数中继续往下执行,即继续进行结点node1的插入操作。
最终结果是,main函数和sighandler函数先后向链表中插入了两个结点,但最后只有node1结点真正插入到了链表中,而node2结点就再也找不到了,造成了内存泄漏。
上述例子中,各函数执行的先后顺序如下:
像上例这样,insert函数被不同的控制流调用(main函数和sighandler函数使用不同的堆栈空间,它们之间不存在调用与被调用的关系,是两个独立的控制流程),有可能在第一次调用还没返回时就再次进入该函数,我们将这种现象称之为重入。
而insert函数访问一个全局链表,有可能因为重入而造成错乱,像这样的函数我们称之为不可重入函数,反之,如果一个函数只访问自己的局部变量或参数,则称之为可重入(Reentrant)函数。
如果一个函数符合以下条件之一则是不可重入的:
volatile是C语言的一个关键字,该关键字的作用是保持内存的可见性。
在下面的代码中,我们对2号信号进行了捕捉,当该进程收到2号信号时会将全局变量flag由0置1。也就是说,在进程收到2号信号之前,该进程会一直处于死循环状态,直到收到2号信号时将flag置1才能够正常退出。
- #include <stdio.h>
- #include <signal.h>
-
- int flag = 0;
-
- void handler(int signo)
- {
- printf("get a signal:%d\n", signo);
- flag = 1;
- }
- int main()
- {
- signal(2, handler);
- while (!flag);
- printf("Proc Normal Quit!\n");
- return 0;
- }
该程序的运行过程好像都在我们的意料之中,但实际并非如此。代码中的main函数和handler函数是两个独立的执行流,而while循环是在main函数当中的,在编译器编译时只能检测到在main函数中对flag变量的使用。
此时编译器检测到在main函数中并没有对flag变量做修改操作,在编译器优化级别较高的时候,就有可能将flag设置进寄存器里面。
此时main函数在检测flag时只检测寄存器里面的值,而handler执行流只是将内存中flag的值置为1了,那么此时就算进程收到2号信号也不会跳出死循环。
在编译代码时携带-O3
选项使得编译器的优化级别最高,此时再运行该代码,就算向进程发生2号信号,该进程也不会终止。
面对这种情况,我们就可以使用volatile关键字对flag变量进行修饰,告知编译器,对flag变量的任何操作都必须真实的在内存中进行,即保持了内存的可见性。
- #include <stdio.h>
- #include <signal.h>
-
- volatile int flag = 0;
-
- void handler(int signo)
- {
- printf("get a signal:%d\n", signo);
- flag = 1;
- }
- int main()
- {
- signal(2, handler);
- while (!flag);
- printf("Proc Normal Quit!\n");
- return 0;
- }
此时就算我们编译代码时携带-O3
选项,当进程收到2号信号将内存中的flag变量置1时,main函数执行流也能够检测到内存中flag变量的变化,进而跳出死循环正常退出。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。