当前位置:   article > 正文

【Linux】模拟实现shell(bash)

【Linux】模拟实现shell(bash)

目录

常见的与shell互动场景

实现代码

全部代码

homepath()接口

const char *getUsername()接口

const char *getHostname()接口

const char *getCwd()接口

int getUserCommand(char *command, int num)接口

void commandSplit(char *in, char *out[])接口

int execute(char *argv[])接口

void cd(const char *path)接口

int doBuildin(char *argv[])接口

main函数


常见的与shell互动场景

  • 用下图的时间轴来表示事件的发生次序。其中时间从左向右。shell由标识为sh的方块代表,它随着时的流逝从左向右移动。shell从用户读入字符串"ls"。shell建立一个新的进程,然后在那个进程中运行ls程序并等待那个进程结束。

  • 然后shell读取新的一行输入,建立一个新的进程,在这个进程中运行程序 并等待这个进程结束。所以要写一个shell,需要循环以下过程

  1. 获取命令行

  2. 解析命令行

  3. 建立一个子进程(fork)

  4. 替换子进程(execvp)

  5. 父进程等待子进程退出(wait)

  • 根据这些思路,和我们前面的学的技术,就可以自己来实现一个shell了

实现代码

全部代码

  • 这段代码是一个简单的命令行解释器,类似于Linux中的shell。它接受用户输入的命令,并通过执行系统调用来实现命令的执行。

  • 主要的功能包括:

  • 提示符:获取用户输入的命令字符串。

  • 分割字符串:将用户输入的命令字符串分割成命令及其参数。

  • 内建命令检测:检查用户输入的命令是否是内建命令(如cd、export、echo等)。

  • 执行命令:执行用户输入的命令或者外部可执行程序。

  • 代码中使用了一些C标准库函数和系统调用,其中比较重要的部分包括fork创建子进程,execvp执行外部命令,waitpid等待子进程退出,以及内建命令的处理。

  • 整个程序的逻辑是不断循环,获取用户输入的命令,然后根据用户输入执行相应的操作。内建命令会被直接在主进程中执行,而外部命令则会创建子进程来执行。

  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include <string.h>
  4. #include <unistd.h>
  5. #include <sys/types.h>
  6. #include <sys/wait.h>
  7. #define NUM 1024
  8. #define SIZE 64
  9. #define SEP " "
  10. //#define Debug 1
  11. char cwd[1024];
  12. char enval[1024]; // for test
  13. int lastcode = 0;
  14. char *homepath()
  15. {
  16.     char *home = getenv("HOME");
  17.     if(home) return home;
  18.     else return (char*)".";
  19. }
  20. const char *getUsername()
  21. {
  22.     const char *name = getenv("USER");
  23.     if(name) return name;
  24.     else return "none";
  25. }
  26. const char *getHostname()
  27. {
  28.     const char *hostname = getenv("HOSTNAME");
  29.     if(hostname) return hostname;
  30.     else return "none";
  31. }
  32. const char *getCwd()
  33. {
  34.     const char *cwd = getenv("PWD");
  35.     if(cwd) return cwd;
  36.     else return "none";
  37. }
  38. int getUserCommand(char *command, int num)
  39. {
  40.     printf("[%s@%s %s]# ", getUsername(), getHostname(), getCwd());
  41.     char *= fgets(command, num, stdin); // 最终你还是会输入\n
  42.     if(r == NULLreturn -1;
  43.     // "abcd\n" "\n"
  44.     command[strlen(command) - 1= '\0'// 有没有可能越界?不会
  45.     return strlen(command);
  46. }
  47. void commandSplit(char *in, char *out[])
  48. {
  49.     int argc = 0;
  50.     out[argc++= strtok(in, SEP);
  51.     while( out[argc++= strtok(NULL, SEP));
  52. #ifdef Debug
  53.     for(int i = 0; out[i]; i++)
  54.     {
  55.         printf("%d:%s\n", i, out[i]);
  56.     }
  57. #endif
  58. }
  59. int execute(char *argv[])
  60. {
  61.     pid_t id = fork();
  62.     if(id < 0return -1;
  63.     else if(id == 0//child
  64.     {
  65.         // exec command
  66.         execvp(argv[0], argv); // cd ..
  67.         exit(1);
  68.     }
  69.     else // father
  70.     {
  71.         int status = 0;
  72.         pid_t rid = waitpid(id, &status0);
  73.         if(rid > 0){
  74.             lastcode = WEXITSTATUS(status);
  75.         }
  76.     }
  77.     return 0;
  78. }
  79. void cd(const char *path)
  80. {
  81.     chdir(path);
  82.     char tmp[1024];
  83.     getcwd(tmp, sizeof(tmp));
  84.     sprintf(cwd, "PWD=%s", tmp); // bug
  85.     putenv(cwd);
  86. }
  87. // 什么叫做内键命令: 内建命令就是bash自己执行的,类似于自己内部的一个函数!
  88. // 1->yes, 0->no, -1->err
  89. int doBuildin(char *argv[])
  90. {
  91.     if(strcmp(argv[0], "cd"== 0)
  92.     {
  93.         char *path = NULL;
  94.         if(argv[1== NULL) path=homepath();
  95.         else path = argv[1];
  96.         cd(path);
  97.         return 1;
  98.     }
  99.     else if(strcmp(argv[0], "export"== 0)
  100.     {
  101.         if(argv[1== NULLreturn 1;
  102.         strcpy(enval, argv[1]);
  103.         putenv(enval); // ???
  104.         return 1;
  105.     }
  106.     else if(strcmp(argv[0], "echo"== 0)
  107.     {
  108.         if(argv[1== NULL){
  109.             printf("\n");
  110.             return 1;
  111.         }
  112.         if(*(argv[1]) == '$' && strlen(argv[1]) > 1){ 
  113.             char *val = argv[1]+1// $PATH $?
  114.             if(strcmp(val, "?"== 0)
  115.             {
  116.                 printf("%d\n", lastcode);
  117.                 lastcode = 0;
  118.             }
  119.             else{
  120.                 const char *enval = getenv(val);
  121.                 if(enval) printf("%s\n", enval);
  122.                 else printf("\n");
  123.             }
  124.             return 1;
  125.         }
  126.         else {
  127.             printf("%s\n", argv[1]);
  128.             return 1;
  129.         }
  130.     }
  131.     else if(0){}
  132.     return 0;
  133. }
  134. int main()
  135. {
  136.     while(1){
  137.         char usercommand[NUM];
  138.         char *argv[SIZE];
  139.         // 1. 打印提示符&&获取用户命令字符串获取成功
  140.         int n = getUserCommand(usercommand, sizeof(usercommand));
  141.         if(n <= 0continue;
  142.         // 2. 分割字符串
  143.         // "ls -a -l" -> "ls" "-a" "-l"
  144.         commandSplit(usercommand, argv);
  145.         // 3. check build-in command
  146.         n = doBuildin(argv);
  147.         if(n) continue;
  148.         // 4. 执行对应的命令
  149.         execute(argv);
  150.     }
  151. }

homepath()接口

  • char homepath():这是一个函数声明,指定了函数的返回类型为 char,表示返回一个字符指针。

  • char *home = getenv("HOME");:调用 getenv() 函数来获取环境变量 "HOME" 的值,并将其存储在 home 变量中。环境变量 "HOME" 通常包含用户的家目录路径。

  • if(home) return home;:检查 home 变量是否为非空(即环境变量 "HOME" 是否存在)。如果环境变量 "HOME" 存在,就直接返回该路径。

  • else return (char*)".";:如果环境变量 "HOME" 不存在(即 home 为 NULL),则返回一个点号 ".",表示当前目录。

  1. char *homepath()
  2. {
  3.     char *home = getenv("HOME");
  4.     if(home) return home;
  5.     else return (char*)".";
  6. }

const char *getUsername()接口

  1. const char *getUsername()
  2. {
  3.     const char *name = getenv("USER");
  4.     if(name) return name;
  5.     else return "none";
  6. }
  • 这个函数用于获取当前用户的用户名。

  • 首先调用 getenv("USER") 来获取环境变量 "USER" 的值,并将其存储在名为 name 的常量字符指针中。

  • 然后使用条件语句检查 name 是否非空,如果非空则返回该用户名,否则返回字符串 "none"。

  • 返回的类型是 const char*,表示返回一个指向常量字符的指针,即返回的用户名字符串不可被修改。

const char *getHostname()接口

  1. const char *getHostname()
  2. {
  3.     const char *hostname = getenv("HOSTNAME");
  4.     if(hostname) return hostname;
  5.     else return "none";
  6. }
  • 这个函数用于获取主机名。

  • 类似于 getUsername() 函数,它首先调用 getenv("HOSTNAME") 来获取环境变量 "HOSTNAME" 的值,并将其存储在名为 hostname 的常量字符指针中。

  • 使用条件语句检查 hostname 是否非空,如果非空则返回该主机名,否则返回字符串 "none"。 返回的类型也是 const char*,表示返回一个指向常量字符的指针。

const char *getCwd()接口

  1. const char *getCwd()
  2. {
  3.     const char *cwd = getenv("PWD");
  4.     if(cwd) return cwd;
  5.     else return "none";
  6. }
  • 这个函数用于获取当前工作目录的路径。

  • 类似于前两个函数,它首先调用 getenv("PWD") 来获取环境变量 "PWD" 的值,并将其存储在名为 cwd 的常量字符指针中。

  • 使用条件语句检查 cwd 是否非空,如果非空则返回当前工作目录的路径,否则返回字符串 "none"。

  • 也是返回类型是 const char*,表示返回一个指向常量字符的指针。

int getUserCommand(char *command, int num)接口

  1. int getUserCommand(char *command, int num)
  2. {
  3.     printf("[%s@%s %s]# ", getUsername(), getHostname(), getCwd());
  4.     char *= fgets(command, num, stdin); // 最终你还是会输入\n
  5.     if(r == NULLreturn -1;
  6.     // "abcd\n" "\n"
  7.     command[strlen(command) - 1= '\0'// 有没有可能越界?不会
  8.     return strlen(command);
  9. }
  • 这个函数接受两个参数:command 是一个字符数组,用于存储用户输入的命令;num 是一个整数,表示 command 数组的长度。

  • 首先通过调用 getUsername()、getHostname() 和 getCwd() 函数来获取当前用户的用户名、主机名和当前工作目录,并使用 printf 函数输出提示符 [用户名@主机名 当前目录]#。

  • 调用 fgets(command, num, stdin) 来从标准输入中读取用户输入的命令,并将其存储在 command 中,最多读取 num-1 个字符(包括换行符)。

  • 检查 fgets 的返回值 r 是否为 NULL,如果为 NULL 则说明读取失败,直接返回 -1。

  • 将用户输入的命令中的换行符替换为字符串结束符 \0,确保命令字符串的结尾正确。

  • 返回用户输入的命令的长度,不包括换行符。

command[strlen(command) - 1] = '\0';
  • 这行代码将用户输入的命令中的换行符(\n)替换为字符串结束符(\0),从而消除换行符并确保命令字符串的正确结束。

  • 通过 strlen(command) 获取用户输入的命令的长度,然后将倒数第二个字符(即换行符)改为字符串结束符,这样就能正确截断换行符。

void commandSplit(char *in, char *out[])接口

  1. void commandSplit(char *inchar *out[])
  2. {
  3.     int argc = 0;
  4.     out[argc++] = strtok(in, SEP);
  5.     whileout[argc++] = strtok(NULL, SEP));
  6. #ifdef Debug
  7.     for(int i = 0out[i]; i++)
  8.     {
  9.         printf("%d:%s\n", i, out[i]);
  10.     }
  11. #endif
  12. }
  • 这个函数接受两个参数:in 是输入的命令字符串,out[] 是一个字符串数组,用于存储分割后的子串。

  • 在函数内部定义了一个整型变量 argc 用于记录分割后子串的数量,并初始化为 0。

  • 调用 strtok(in, SEP) 来以 SEP 作为分隔符对输入的命令字符串进行第一次分割,并将第一个分割后的子串存储在 out 数组中,同时 argc 自增。

  • 使用循环结构 while 不断调用 strtok(NULL, SEP) 进行后续的分割,直到没有更多的子串可分割。

  • 分割后的每个子串都会被存储在 out 数组中,并且 argc 会记录子串的数量。

#ifdef Debug ... #endif
  • 这部分代码使用了条件编译,只有在定义了 Debug 宏的情况下才会编译执行其中的代码。

  • 在这个条件编译块中,通过循环遍历输出存储子串的 out 数组,依次打印每个子串的内容和索引。

int execute(char *argv[])接口

  1. int execute(char *argv[])
  2. {
  3.     pid_t id = fork();
  4.     if(id < 0return -1;
  5.     else if(id == 0//child
  6.     {
  7.         // exec command
  8.         execvp(argv[0], argv); // cd ..
  9.         exit(1);
  10.     }
  11.     else // father
  12.     {
  13.         int status = 0;
  14.         pid_t rid = waitpid(id, &status0);
  15.         if(rid > 0){
  16.             lastcode = WEXITSTATUS(status);
  17.         }
  18.     }
  19.     return 0;
  20. }
  • 这个函数接受一个参数 argv[],是一个字符串数组,包含了要执行的命令及其参数。

  • 在函数内部,首先调用 fork() 创建一个子进程。如果创建子进程失败,fork() 返回值小于 0,函数直接返回 -1。

  • 如果 fork() 返回值等于 0,说明当前处于子进程中,接着调用 execvp(argv[0], argv) 来执行用户输入的命令。如果 execvp 执行成功,子进程将被替换为新的程序,否则子进程会退出,并返回值为 1。

  • 如果 fork() 返回值大于 0,说明当前处于父进程中。父进程会调用 waitpid(id, &status, 0) 来等待子进程结束,并获取子进程的状态信息。如果成功等到子进程结束,就会将子进程的退出状态存储在 lastcode 中。

  • 最后,函数返回值为 0。

void cd(const char *path)接口

  1. void cd(const char *path)
  2. {
  3.     chdir(path);
  4.     char tmp[1024];
  5.     getcwd(tmp, sizeof(tmp));
  6.     sprintf(cwd, "PWD=%s", tmp); // bug
  7.     putenv(cwd);
  8. }
  • 这个函数接受一个参数 path,是一个指向要切换到的目标路径的指针。

  • 在函数内部,首先调用 chdir(path) 来改变当前工作目录到指定的路径。

  • 接着声明一个名为 tmp 的字符数组,用于存储获取到的当前工作目录路径。

  • 调用 getcwd(tmp, sizeof(tmp)) 来获取当前工作目录的绝对路径,然后将其存储在 tmp 中。

  • 使用 sprintf 函数将当前工作目录路径格式化为 "PWD=当前路径" 的形式,并将格式化后的字符串存储在全局变量 cwd 中。这里提到了一个潜在的 bug,因为 cwd 变量可能没有足够的空间来存储格式化后的字符串。

  • 最后,调用 putenv(cwd) 来更新环境变量 PWD 的数值为当前工作目录的路径。

int doBuildin(char *argv[])接口

  1. int doBuildin(char *argv[])
  2. {
  3.     if(strcmp(argv[0], "cd"== 0)
  4.     {
  5.         char *path = NULL;
  6.         if(argv[1== NULL) path=homepath();
  7.         else path = argv[1];
  8.         cd(path);
  9.         return 1;
  10.     }
  11.     else if(strcmp(argv[0], "export"== 0)
  12.     {
  13.         if(argv[1== NULLreturn 1;
  14.         strcpy(enval, argv[1]);
  15.         putenv(enval); // ???
  16.         return 1;
  17.     }
  18.     else if(strcmp(argv[0], "echo"== 0)
  19.     {
  20.         if(argv[1== NULL){
  21.             printf("\n");
  22.             return 1;
  23.         }
  24.         if(*(argv[1]) == '$' && strlen(argv[1]) > 1){ 
  25.             char *val = argv[1]+1// $PATH $?
  26.             if(strcmp(val, "?"== 0)
  27.             {
  28.                 printf("%d\n", lastcode);
  29.                 lastcode = 0;
  30.             }
  31.             else{
  32.                 const char *enval = getenv(val);
  33.                 if(enval) printf("%s\n", enval);
  34.                 else printf("\n");
  35.             }
  36.             return 1;
  37.         }
  38.         else {
  39.             printf("%s\n", argv[1]);
  40.             return 1;
  41.         }
  42.     }
  43.     else if(0){}
  44.     return 0;
  45. }
  • 这个函数接受一个参数 argv[],是一个字符串数组,包含了用户输入的命令及其参数。

  • 首先通过比较 argv[0] 和内置命令的字符串来判断用户输入的命令是哪个内置命令。

  • 如果用户输入的是 cd 命令,则调用 cd 函数来改变当前工作目录到指定路径。如果用户没有输入路径,则调用 homepath() 函数获取主目录路径作为默认路径。

  • 如果用户输入的是 export 命令,则将传入的参数 argv[1] 复制到全局变量 enval 中,并调用 putenv(enval) 来更新环境变量。

  • 如果用户输入的是 echo 命令,则根据参数进行相应的输出操作:

  • 若参数以 $ 开头且长度大于1,则尝试获取环境变量的值并输出;如果参数是 ?,则输出最近一次命令的退出状态。

  • 若参数不以 $ 开头,则直接输出参数。

  • 最后,根据用户输入的命令执行相应的操作,并返回 1 表示成功处理了内置命令。

main函数

  1. int main()
  2. {
  3.     while(1){
  4.         char usercommand[NUM];
  5.         char *argv[SIZE];
  6.         // 1. 打印提示符&&获取用户命令字符串获取成功
  7.         int n = getUserCommand(usercommand, sizeof(usercommand));
  8.         if(n <= 0continue;
  9.         // 2. 分割字符串
  10.         // "ls -a -l" -> "ls" "-a" "-l"
  11.         commandSplit(usercommand, argv);
  12.         // 3. check build-in command
  13.         n = doBuildin(argv);
  14.         if(n) continue;
  15.         // 4. 执行对应的命令
  16.         execute(argv);
  17.     }
  18. }
  • 主函数包含一个无限循环,表示该命令解释器会持续等待用户输入并执行对应的命令,直到手动停止程序运行。

  • 在每一轮循环中:

  1. 定义了存储用户命令的字符数组 usercommand 和用于存储分割后命令的字符串数组 argv。

  2. 调用 getUserCommand 函数获取用户输入的命令字符串,并返回字符串长度。

  3. 如果用户未输入命令(n <= 0),则继续下一轮循环等待用户输入。

  4. 调用 commandSplit 函数将用户输入的命令字符串分割为命令及参数,并保存到 argv 数组中。

  5. 调用 doBuildin 函数来检查是否存在内置命令,如果存在内置命令则执行相应操作,返回值 n 不为 0 则表示已处理内置命令,继续下一轮循环。

  6. 如果不是内置命令,则调用 execute 函数执行对应的外部命令。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/308441
推荐阅读
相关标签
  

闽ICP备14008679号