当前位置:   article > 正文

词法分析练习一:简单提取token_词法分析 token

词法分析 token

词法分析练习一:简单提取token
思路:

  1. 第一次碰到字母,下划线: 开启新token, 设置type=identify; 直到遇见非(字母,数字,下划线 截止), 则以上为一个标识符
  2. 第一次碰到数字: 开启新token, 设置type=number; 直到遇见非(数字,字母U,L,u,l)截止, 则以上为一个数字
typedef char bool;
#define true 1
#define false 0

#define CASE_ALPHA_LOWER    case 'a': case 'b': case 'c': case 'd': case 'e': case 'f': case 'g': case 'h': case 'i': case 'j': case 'k': case 'l': case 'm': case 'n': \
                            case 'o': case 'p': case 'q': case 'r': case 's': case 't': case 'u': case 'v': case 'w': case 'x': case 'y': case 'z':

#define CASE_ALPHA_UPPER    case 'A': case 'B': case 'C': case 'D': case 'E': case 'F': case 'G': case 'H': case 'I': case 'J': case 'K': case 'L': case 'M': case 'N': \
                            case 'O': case 'P': case 'Q': case 'R': case 'S': case 'T': case 'U': case 'V': case 'W': case 'X': case 'Y': case 'Z':

#define CASE_NUM            case '0': case '1': case '2': case '3': case '4': case '5': case '6': case '7': case '8': case '9':

#define CASE_UNDERLINE      case '_':

#define CASE_LINEEND        case '\0':

enum token_type
{
    TOKEN_IDENTIFY,
    TOKEN_NUMBER,
    TOKEN_LINEFEED,
};

typedef struct token
{
    enum token_type type;
    char str[256];
    unsigned char len;
} token_t;

void parse_token(char* str)
{
    bool in_token = false;
    token_t cur_token;
    cur_token.len = 0;

    while(1)
    {
        char c = *str++;
        switch(c)
        {
            CASE_ALPHA_LOWER
            CASE_ALPHA_UPPER
            CASE_UNDERLINE
            {
                if (in_token == false) {
                    //first token set type
                    cur_token.type = TOKEN_IDENTIFY;
                    in_token = true;
                }

                //save char
                cur_token.str[cur_token.len++] = c;
                break;
            }
            CASE_NUM
            {
                if (in_token == false) {
                    //first token set type
                    cur_token.type = TOKEN_NUMBER;
                    in_token = true;
                }
                //save char
                cur_token.str[cur_token.len++] = c;
                break;
            }
            default:
            {
                if (in_token == true) {
                    //token end
                    cur_token.str[cur_token.len] = '\0';
                    if (cur_token.len) {
                        printf("token type %d: str [%s] \n", cur_token.type, cur_token.str);
                        //get back for next time parse from current char
                        str--;
                    }
                    else {
                        printf("warning unexpect here");
                    }
                    cur_token.len = 0;
                    in_token = false;
                }
                else {
                    //do nothing
                    printf("[%c]\n", c);
                }
                break;
            }
        }

        if (c == '\0') {
            printf("line end\n");
            return;
        }
    }

}

int main(int argc, char* argv[])
{
    printf("please input string to parse\n");
    char string[1024];
    while(1)
    {
        gets(string);
        parse_token(string);
    }
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54
  • 55
  • 56
  • 57
  • 58
  • 59
  • 60
  • 61
  • 62
  • 63
  • 64
  • 65
  • 66
  • 67
  • 68
  • 69
  • 70
  • 71
  • 72
  • 73
  • 74
  • 75
  • 76
  • 77
  • 78
  • 79
  • 80
  • 81
  • 82
  • 83
  • 84
  • 85
  • 86
  • 87
  • 88
  • 89
  • 90
  • 91
  • 92
  • 93
  • 94
  • 95
  • 96
  • 97
  • 98
  • 99
  • 100
  • 101
  • 102
  • 103
  • 104
  • 105
  • 106
  • 107
  • 108

运行结果
在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/935335
推荐阅读
相关标签
  

闽ICP备14008679号