C語言怎麼實現可變引數

東垂小夫發表於2021-07-22

原文網址 : https://www.cnblogs.com/chuganghong/p/15045539.html

可變引數

可變引數是指函式的引數的資料型別和數量都是不固定的。

printf函式的引數就是可變的。這個函式的原型是：int printf(const char *format, ...)。

用一段程式碼演示printf的用法。

// code-A
#include <stdio.h>
int main(int argc, char **argv)
{
  	printf("a is %d, str is %s, c is %c\n", 23, "Hello, World;", 'A');
  	printf("T is %d\n", 78);
  	return 0;
}

在code-A中，第一條printf語句有4個引數，第二條printf語句有2個引數。顯然，printf的引數是可變的。

實現

程式碼

code-A

先看兩段程式碼，分別是code-A和code-B。

// file stack-demo.c

#include <stdio.h>

// int f(char *fmt, int a, char *str);
int f(char *fmt, ...);
int f2(char *fmt, void *next_arg);
int main(int argc, char *argv)
{
        char fmt[20] = "hello, world!";
        int a = 10;
        char str[10] = "hi";
        f(fmt, a, str);
        return 0;
}

// int f(char *fmt, int a, char *str)
int f(char *fmt, ...)
{
        char c = *fmt;
        void *next_arg = (void *)((char *)&fmt + 4);
        f2(fmt, next_arg);
        return 0;
}


int f2(char *fmt, void *next_arg)
{
        printf(fmt);
        printf("a is %d\n", *((int *)next_arg));
        printf("str is %s\n", *((char **)(next_arg + 4)));

        return 0;
}

編譯執行，結果如下：

# 編譯
[root@localhost c]# gcc -o stack-demo stack-demo.c -g -m32
# 反彙編並把彙編程式碼寫入dis-stack.asm中
[root@localhost c]# objdump -d stack-demo>dis-stack.asm
[root@localhost c]# ./stack-demo
hello, world!a is 10
str is hi

code-B

// file stack-demo.c

#include <stdio.h>

// int f(char *fmt, int a, char *str);
int f(char *fmt, ...);
int f2(char *fmt, void *next_arg);
int main(int argc, char *argv)
{
        char fmt[20] = "hello, world!";
        int a = 10;
        char str[10] = "hi";
  			char str2[10] = "hello";
        f(fmt, a, str, str2);
        return 0;
}

// int f(char *fmt, int a, char *str)
int f(char *fmt, ...)
{
        char c = *fmt;
        void *next_arg = (void *)((char *)&fmt + 4);
        f2(fmt, next_arg);
        return 0;
}


int f2(char *fmt, void *next_arg)
{
        printf(fmt);
        printf("a is %d\n", *((int *)next_arg));
        printf("str is %s\n", *((char **)(next_arg + 4)));
  			printf("str2 is %s\n", *((char **)(next_arg + 8)));

        return 0;
}

編譯執行，結果如下：

# 編譯
[root@localhost c]# gcc -o stack-demo stack-demo.c -g -m32
# 反彙編並把彙編程式碼寫入dis-stack.asm中
[root@localhost c]# objdump -d stack-demo>dis-stack.asm
[root@localhost c]# ./stack-demo
hello, world!a is 10
str is hi
str2 is hello

分析

在code-A中，呼叫f的語句是f(fmt, a, str);；在code-B中，呼叫f的語句是f(fmt, a, str, str2);。

很容易看出，int f(char *fmt, ...);就是引數可變的函式。

關鍵語句

實現可變引數的關鍵語句是：

char c = *fmt;
void *next_arg = (void *)((char *)&fmt + 4);
printf("a is %d\n", *((int *)next_arg));
printf("str is %s\n", *((char **)(next_arg + 4)));
printf("str2 is %s\n", *((char **)(next_arg + 8)));

&fmt是第一個引數的記憶體地址。
next_arg是第二個引數的記憶體地址。
next_arg+4、next_arg+8分別是第三個、第四個引數的記憶體地址。

為什麼

記憶體地址的計算方法

先看一段虛擬碼。這段虛擬碼是f函式的對應的彙編程式碼。假設f有三個引數。當然f也可以有四個引數或2個引數。我們用三個引數的情況來觀察一下f。

f:
	; 入棧ebp
	; 把ebp設定為esp
	
	; ebp + 0 儲存的是 eip，由call f入棧
	; ebp + 4 儲存的是 舊ebp
	; 第一個引數是 ebp + 8
	; 第二個引數是 ebp + 12
	; 第三個引數是 ebp + 16
	
	; 函式f的邏輯
	
	; 出棧ebp。ebp恢復成了剛進入函式之前的舊ebp
	; ret

呼叫f的虛擬碼是：

; 入棧第三個引數
; 入棧第二個引數
; 入棧第一個引數
; 呼叫f，把eip入棧

在彙編程式碼中，第一個引數的記憶體地址很容易確定，第二個、第三個還有第N個引數的記憶體地址也非常容易確定。無法是在ebp的基礎上增加特定長度而已。

可是，我們只能確定，必定存在第一個引數，不能確定是否存在的二個、第三個還有第N個引數。沒有理由使用一個可能不存在的引數作為參照物、並且還要用它卻計算其他引數的地址。

第一個引數必定存在，所以，我們用它作為確定其他引數的記憶體地址的參照物。

記憶體地址

在f函式的C程式碼中，&fmt是第一個引數佔用的f的棧的元素的記憶體地址，換句話說，是一個區域性變數的記憶體地址。

區域性變數的記憶體地址不能作為函式的返回值，卻能夠在本函式執行結束前使用，包括在本函式呼叫的其他函式中使用。這就是在f2中仍然能夠使用fmt計算出來的記憶體地址的原因。

難點

當引數是int型別時，獲取引數的值使用*(int *)(next_arg)。

當引數是char str[20]時，獲取引數的值使用*(char **)(next_arg + 4)。

為什麼不直接使用next_arg、(next_arg + 4)呢？

分析*(int *)(next_arg)。

在32位作業系統中，任何記憶體地址的值看起來都是一個32位的正整數。可是這個正整數的值的型別並不是unsigned int，而是int *。

關於這點，我們可以在gdb中使用ptype確認一下。例如，有一小段程式碼int *a;*a = 5;，執行ptype a，結果會是int *。

next_arg只是一個正整數，損失了它的資料型別，我們需要把資料型別補充進來。我們能夠把這個操作理解成”強制型別轉換“。

至於*(int *)(next_arg)前面的*，很容易理解，獲取一個指標指向的記憶體中的值。

用通用的方式分析*(char **)(next_arg+4)。

因為是第三個引數，因此next_arg+4。
因為第三個引數的資料型別是char str[20]。根據經驗，char str[20]對應的指標是char *。
因為next_arg+4只是函式的棧的元素的記憶體地址，在目標元素中儲存的是一個指標。也就是說，next_arg+4是一個雙指標型別的指標。它最終又指向字串，根據經驗，next_arg+4的資料型別是char **。沒必要太糾結這一點。自己寫一個簡單的指向字串的雙指標，使用gdb的ptype檢視這種型別的資料型別就能驗證這一點。
最前面的*，獲取指標指向的資料。

給出一段驗證第3點的程式碼。

char str[20] = "hello";
char *ptr = str;
// 使用gdb的ptype 列印 ptype &ptr

列印結果如下：

Breakpoint 1, main (argc=1, argv=0xffffd3f4) at point.c:13
13		char str7[20] = "hello";
(gdb) s
14		char *ptr = str7;
(gdb) s
19		int b = 7;
(gdb) p &str
$1 = (char **) 0xffffd2fc

優化

在code-A和code-B中，我們人工根據引數的型別來獲取引數，使用*(int *)(next_arg)或*(char **)(next_arg + 4)。

庫函式printf顯然不是人工識別引數的型別。

這個函式的第一個引數中包含%d、%x、%s等佔位符。遍歷第一個引數，識別出%d，就用*(int *)next_arg替換%d。識別出

%s，就用*(char **)next_arg。

實現了識別佔位符並且根據佔位符選擇指標型別的功能，就能實現一個完成度很高的可變引數了。

C語言可變引數詳解
2018-12-31
C語言
C語言實現可變引數列表的system介面：巨集__VA_ARGS__
2018-11-18
C語言
C++反射機制：可變引數模板實現C++反射
2020-09-27
C++反射
C語言可變引數以及printf()、sprintf()、vsprintf() 的區別與聯絡
2018-06-12
C語言
C++反射機制：可變引數模板實現C++反射薦
2018-07-14
C++反射
C++反射機制：可變引數模板實現C++反射（二）
2020-11-29
C++反射
c++可變模板引數
2024-10-07
C++
C 語言是怎樣實現儲存一個 PHP5 的變數？
2019-06-17
PHP變數
C++逆向可變引數Hook
2022-04-21
C++Hook
C++11 可變引數模板
2020-11-24
C++
淺談C#可變引數params
2022-02-08
C#
C語言sizeof()變數、字元、字串
2020-12-05
C語言變數字元字串
C語言學習方法，怎麼學習C語言？
2021-02-01
C語言
GO語言————6.3 傳遞變長引數
2018-06-30
Go
對 “C語言指標變數作為函式引數” 的個人理解
2020-09-25
C語言指標變數函式
自己實現一個簡單可變引數函式
2024-11-03
函式
c語言模擬Python的命名引數
2024-07-28
C語言Python
【Java】可變引數
2018-04-26
Java
C++ 可變引數模板遞迴展開
2024-11-08
C++遞迴
掃雷--C語言實現
2018-05-28
C語言
c語言實現階乘
2024-04-05
C語言
複數的四則運算（C語言實現）
2020-11-28
C語言
C語言-變數常量資料型別
2023-12-02
C語言變數資料型別
C語言--靜態區域性變數
2020-10-05
C語言變數
C語言學習筆記之變數
2020-12-28
C語言筆記變數
go-可變引數
2019-02-16
Go
可變引數例項
2024-08-17
Swift 呼叫 Objective-C 的可變引數函式
2018-03-24
SwiftObject函式
C語言__LINE__實現原理
2019-01-15
C語言
C語言實現檔案加密
2024-05-01
C語言加密
c語言實現this指標效果
2023-12-04
C語言指標
高精度加法（C語言實現）
2023-11-04
C語言
C語言實現TCP通訊
2020-04-18
C語言TCP
C語言指標（二）指標變數 ----by xhxh
2020-12-19
C語言指標變數
go語言變數
2018-06-08
Go變數
可變引數va_list
2019-05-12
Java方法05：可變引數
2024-08-08
Java
Java - 可變引數的使用
2023-03-17
Java