c語言是如何解析表示式語句"2+3*4；"的？

Just_4_fun發表於2021-11-24

原文網址 : https://www.cnblogs.com/iszhang/p/15596715.html

1. 要編譯的測試程式碼：

int main(void)
{
    2+3*4;
}

2. 詞法分析

　　詞法分析將字元變成token，其中很重要的是token的型別，如字元2的token型別為TK_NUM，這在後面的語法分析階段有用。

3. 語法分析

3.1 解析字元"2"

if (tok->kind == TK_NUM) {
    Node *node;
    if (is_flonum(tok->ty)) {
      node = new_node(ND_NUM, tok);
      node->fval = tok->fval;
    } else {
      node = new_num(tok->val, tok);
    }

    node->ty = tok->ty;
    *rest = tok->next;
    return node;
  }

　　如果token型別為數字，則解析數字，2不為浮點數，所以執行else分支。

static Node *new_num(int64_t val, Token *tok) {
  Node *node = new_node(ND_NUM, tok);
  node->val = val;
  return node;
}

　　建立一個型別為ND_NUM的node節點，這個節點就代表了數字2，數字2儲存在node節點的val變數中。

3.2 解析"+"

static Node *add(Token **rest, Token *tok) {
  Node *node = mul(&tok, tok);

  for (;;) {
    Token *start = tok;

    if (equal(tok, "+")) {
      node = new_add(node, mul(&tok, tok->next), start);
      continue;
    }

    if (equal(tok, "-")) {
      node = new_sub(node, mul(&tok, tok->next), start);
      continue;
    }

    *rest = tok;
    return node;
  }
}

　　數字2的node節點由mul函式返回，此時tok為"+"，所以會呼叫new_add函式，在這個函式中會建立型別

為ND_ADD的node節點，這個節點的左表示式為代表數字2的node節點，右表示式為代表乘法運算的node節點。

static Node *new_add(Node *lhs, Node *rhs, Token *tok) {
if (is_numeric(lhs->ty) && is_numeric(rhs->ty))
    return new_binary(ND_ADD, lhs, rhs, tok);
...
}

static Node *new_binary(NodeKind kind, Node *lhs, Node *rhs, Token *tok) {
  Node *node = new_node(kind, tok);
  node->lhs = lhs;
  node->rhs = rhs;
  return node;
}

3.3 解析"*"

static Node *mul(Token **rest, Token *tok) {
  Node *node = cast(&tok, tok);

  for (;;) {
    Token *start = tok;

    if (equal(tok, "*")) {
      node = new_binary(ND_MUL, node, cast(&tok, tok->next), start);
      continue;
    }

    if (equal(tok, "/")) {
      node = new_binary(ND_DIV, node, cast(&tok, tok->next), start);
      continue;
    }

    if (equal(tok, "%")) {
      node = new_binary(ND_MOD, node, cast(&tok, tok->next), start);
      continue;
    }

    *rest = tok;
    return node;：
  }
}

　　mul函式會呼叫cast函式返回代表數字3的型別同樣為ND_NUM的node節點，這點同解析數字2的過程，不再贅述。

　　由於tok此時為"*",所以會建立型別為ND_MUL的乘法node節點，這個節點的左表示式為代表數字3的型別為

ND_NUM的node節點，右表示式為cast函式返回的代表數字4的型別為ND_NUM的node節點。

4. 解析上一步生成的語法樹生成彙編程式碼

static void gen_expr(Node *node) {
    switch (node->kind) {
    case ND_NUM: {
        println("  mov $%ld, %%rax", node->val);
        return;
    ...
    }

    gen_expr(node->rhs);
    push();
    gen_expr(node->lhs);
    pop("%rdi");

    switch (node->kind) {
    case ND_ADD:
        println("  add %s, %s", di, ax);
        return;

    case ND_MUL:
        println("  imul %s, %s", di, ax);
        return;
    ...
    }
...
}

　　4.1 gen_expr的引數為型別為ND_ADD的node節點，首先遞迴呼叫gen_expr，傳入的引數為型別為ND_MUL的
node節點，又會遞迴呼叫gen_expr，傳入的引數為型別為ND_NUM的代表數字4的node節點，此時會生成彙編語句
"mov　　rax, 4",將4載入rax暫存器，gen_expr返回。

　　4.2 push函式生成"push    rax"，將4壓入棧。

　　4.3 gen_expr的引數為型別為ND_NUM的代表數字3的node節點，會生成"mov     rax, 3",將3載入
rax暫存器，gen_expr返回。

　　4.4 pop("%rdi")函式將4彈入rdi暫存器。

　　4.5 由於node節點型別為ND_MUL，所以生成"imul    eax, edi"，計算3*4，結果儲存在eax暫存器中，
並從gen_expr返回。

　　4.6 回到引數為ND_ADD的gen_expr函式中。

　　4.7 push函式生成"push    rax"，將3*4壓入棧。

　　4.8 gen_expr引數為型別為ND_NUM的代表數字2的node節點，會生成"mov     rax, 2",將2載入rax
暫存器，gen_expr返回。

　　4.9 pop("%rdi");函式將3*4彈入rdi暫存器。

　　4.10 由於node節點型別為ND_ADD，所以生成"add     eax, edi"，計算2+3*4，結果儲存在eax
暫存器中，並從gen_expr返回。

c語言if語句是如何變成彙編程式碼的？
2021-11-23
C語言
表示式與語句
2021-08-12
c語言是如何處理函式呼叫的？
2021-11-25
C語言函式
Python中表示式與語句
2019-02-19
Python
表示式和基本語句的規範
2020-04-06
JSP 表示式語言概述
2021-11-03
JS
程式語言中表示式更優於語句
2024-05-09
C語言與嵌入式C語言的區別
2021-04-21
C語言
C語言的函式
2024-06-28
C語言函式
算數表示式求值--c語言課程設計
2021-01-01
C語言
語句和表示式有什麼不同
2022-07-14
Java中如何解析SQL語句、格式化SQL語句、生成SQL語句？
2023-03-07
JavaSQL
標準C語言4
2024-05-05
C語言
C語言常用函式
2020-11-08
C語言函式
C語言 execve()函式
2022-01-09
C語言函式
C語言函式sscanf()的用法
2018-08-03
C語言函式
C語言qsort函式的使用
2020-10-02
C語言函式
Python的運算物件、運算子、表示式和語句
2018-12-22
Python物件
C語言程式設計入門之--第五章C語言基本運算和表示式-part2
2019-08-12
C語言程式設計
x86彙編反編譯到c語言之——(1)表示式求值及賦值語句
2021-11-28
編譯C語言賦值
說說 Spring 表示式語言（SpEL）中的各種表示式型別
2019-03-03
Spring型別
08. C語言函式
2024-05-08
C語言函式
C語言函式指標
2024-10-02
C語言函式指標
C語言基礎函式
2024-07-24
C語言函式
C語言函式呼叫棧
2022-05-14
C語言函式
C語言語句知識結構大學霸IT達人
2021-07-19
C語言
C#語言入門詳解筆記（6）—P13、P14、P15、P16 表示式，語句詳解_1_2_3_4
2021-01-03
C#筆記
python是函式式語言嗎
2021-09-11
Python函式
SQL語言基礎(SELECT語句)
2022-11-18
SQL
程式語言語法：`=`表示賦值，`:`表示型別。
2024-03-05
賦值型別
正規表示式及多語言操作指南
2019-01-19
函數語言程式設計：Lambda 表示式
2023-03-06
函數程式設計
go語言與c語言的相互呼叫
2019-04-09
GoC語言
如何用最短的時間學會C語言，並掌握C語言的精髓所在？
2021-01-29
C語言
rulex：Rust一種新的正規表示式語言
2022-03-12
Rust
c語言中，while(1)語句使用break語句跳出迴圈
2018-11-22
C語言While
C語言庫函式及示例
2018-09-21
C語言函式
C語言解讀assert函式
2020-11-20
C語言函式

c語言是如何解析表示式語句"2+3*4；"的？

相關文章