一覽:初學 C 語言時,大家肯定都被指標這個概念折磨過,一會指向這裡、一會指向那裡,最後把自己給指暈了。本文從一些基本的概念開始介紹指標的基本使用。
記憶體
考慮到初學 C 語言時,大家可能對計算機的組成原理不太瞭解,所以這裡先簡單介紹一些“記憶體”這個概念。
眾所周知,任何東西都需要有物理載體作為基礎。
比如說人產生的“思維”這個東西,我們看不見摸不著,但並不是說它就可以憑空存在了,思維的物理載體就是我們的大腦。“大腦”之於“思維”就如同“土地”之於“人類”。
同樣地,我們看不見摸不著的軟體 / 程式碼也需要類似於“土地”和“大腦”的物理載體——儲存器。
儲存器分為兩種:
- 記憶體:計算機中正在執行的程式以及執行過程中暫時產生的資料都在這裡。
- 外存:那些暫時不需要執行的程式和最終的運算結果儲存在這裡。
比如一個 HelloWorld
程式:
#include <stdio.h>
int main()
{
printf("Hello World!\n");
return 0;
}
寫完儲存之後,程式會被儲存在外存(硬碟)中。
當開始執行時,程式會被從外存調入記憶體中執行,列印 HelloWorld。
上面是記憶體的簡單概念(一個很淺的印象):記憶體可以暫時儲存資料。
那記憶體的結構是什麼樣的?
這裡我們把記憶體想象為一幢有很多房間的酒店,每個房間都有一個獨一無二的房間號。
人就是資料;記憶體就是酒店。
酒店的職責就是供人暫時居住;記憶體的職責就是供資料暫時儲存。
記憶體的結構也像酒店一樣,有很多“房間”,稱之為“記憶體單元”,每個記憶體單元也有一個獨一無二的“房間號”,稱之為“記憶體地址”。資料就“住”在記憶體單元中。
假設現在張三住在酒店的 1001 號房間了。
我們就有以下關係:
房間號為1001的房間住了 客戶張三
放到記憶體中,就是:
記憶體地址為1001的記憶體單元儲存了 整數5
如此一來,我們就可以根據地址1001找到對應的記憶體單元,並對其中資料進行操作了。
但這樣有一個問題,就是為了操作 5,而不得不記住其地址,對於人來說,記憶這麼多數字太麻煩了。
想象一下你平常和別人打招呼時說:“早上好啊,某人的身份證號”,而不是“早上好啊,某人的名字”。
光是記住自己的身份證號就不容易了,更別說別人的了,所以我們平常的稱呼是名字。儘管身份證號唯一,而名字可能會重複。
沒錯,就是名字,使用名字來代替對人不友好的記憶體地址。我們可以給 1001 號記憶體單元取個名字,就叫 a
吧。
我們取的這個“名字”就是程式語言都會有的“變數名”。
int a = 5;
變數名對我們人類來說就很友好了,什麼 zhangsan
、lisi
等等都可以起。
通過變數名,就可以訪問其值了。現在我們有一個變數 a
,儲存了值 5
,可以直接通過變數名列印其值:
int a = 5;
printf("%d", a);
但這樣也出現了一個問題,就是我們不知道某個變數的地址了。
這就好比,你去酒店找張三,只知道他名字叫張三,而不知道他的房間號是多少,怎麼辦?一間間的敲門嗎?
不可能。我們應該去前臺問工作人員:“請問張三的房間號是多少?”,前臺工作人員會告訴我們:“1001號”
類似地,要獲取某個變數的地址,我們也可以向“前臺的工作人員”詢問:“請問變數 a
的‘房間號’是多少?”,當然,在現在的語境下,這句話就變成了“請問變數 a
的記憶體地址是多少?”。
在 C 語言中,這個充當“前臺工作人員”的角色的是取地址運算子 &
。
int a = 5;
printf("%p", &a); //請問a的記憶體地址是多少?
通過 &
,我們可以得到某個變數的記憶體地址,通常是一串十六進位制數字,比如 0061FF1C。
到這裡就一切安好了嗎?不!
指標
概念
至此,我們只有能力得到某個變數的記憶體地址,即使用 &
。現在的問題是我們如何使用它。
為什麼現實中的人和事都會有一個名字?為了方便稱呼和使用。
名字之於事物,就好比刀柄之於刀身。一件事物一旦有了名字,我們就有了使用他的力量。
在程式中,我們會有大量的資料,為了使用這些資料,我們有了變數和變數名的概念。比如整型資料用整型變數儲存:
int i = 5;
float f = 5.0;
char c = 'x';
地址也屬於資料,換句話說,我們也應該有某種型別的變數來儲存地址:
int a = 5;
int p = &i; //錯誤程式碼
我們的目的是使用變數 p
來儲存 int
型別變數a
的地址,但是上面的程式碼是錯誤的。因為我們的變數 p
被宣告為 int
型別,所以變數 p
就只能儲存 int
型別資料,而不能儲存 int
型別變數的地址。
這個時候我們就需要一種能儲存整型變數的地址的變數,C 語言為我們提供了一種機制——指標。
int a = 5;
int *pa = &a;
現在我們宣告瞭一個能儲存 int
型別變數的地址 的變數 pa
,然後使用 &
獲取變數 a
的地址,賦值給變數 pa
,非常完美。
這裡的 pa
,就是一個指標(pointer)。可以看一下指標的定義:
In computer science, a pointer is an object in many programming languages that stores a memory address.
在電腦科學中,指標是許多語言中儲存記憶體地址的物件。這裡的物件可以是變數、結構體、函式或方法。
即,指標中儲存的是記憶體地址。
指標的宣告需要使用 *
來表示該變數是一個指標變數:
[pointer_type] *[pointer_name];
int a = 5;
float b = 5.0;
char c = 'x';
int *pa = &a;
float *pb = &b;
char *pc = &c;
由於指標中儲存了某個變數的地址,所以我們可以說該指標指向了那個變數。比如 pa
被宣告為了指向 int
型別的指標,指向了變數 a
。
間接訪問操作符
我們有了取地址運算子 &
用來獲取某個變數的地址,也知道了如何宣告某種型別的指標用來儲存地址。
知道如何獲取了、懂了怎麼儲存了,那麼怎麼使用指標呢?
房間號不是用來好看的,而是用來找到房間和房間中的人。我們已經通過
&
這個“前臺工作人員”找到了房間號並記了下來,下一步就是上門把人找出來。
通過間接訪問操作符 *
,我們就可以根據指標“上門找人”了。
int a = 5; //變數a中儲存5
int *pa = &a; //獲取房間號
printf("%d", *pa); //上門找人
*pa
,就是取指標 pa
所指向的變數的值。
區分
初學 C語言時會容易混淆一些概念,所以這裡區分一下。
int a = 5;
int b = 6;
int c = 7;
int *pa = &a;
int *pb = &b;
int *pc = &b;
printf("a = %d\n", a);
printf("b = %d\n", b);
printf("c = %d\n", c);
printf("&a = %p\n", &a);
printf("&b = %p\n", &b);
printf("&c = %p\n", &c);
printf("pa = %p\n", pa);
printf("pb = %p\n", pb);
printf("pc = %p\n", pc);
printf("*pa = %d\n", *pa);
printf("*pb = %d\n", *pb);
printf("*pc = %d\n", *pc);
輸出為
a = 5
b = 6
c = 7
&a = 0061FF10
&b = 0061FF0C
&c = 0061FF08
pa = 0061FF10
pb = 0061FF0C
pc = 0061FF0C
*pa = 5
*pb = 6
*pc = 6
a
:變數&a
:a
的地址int *pa
:宣告一個指向int
型別的指標pa
pa
:指標*pa
:指標pa
指向的變數值
int *pa
和 *pa
中的 *
不一樣,這一點容易讓人迷惑。在宣告時,int *
是一起的,用來宣告一個指向 int
型別變數的指標,雖然寫開了,但不要分開來看。
int a; //宣告瞭一個變數a
int *pa; //宣告瞭一個變數pa
& 和 *
是一對相反的操作,& 根據變數求地址, *
根據地址求變數。
int a = 5;
printf("%d", *&a); //5
printf("%d", a); //5
*&a
的值為 5,即 a
。
初始化
我們在宣告某個變數後,在使用某個變數前,一定要對其進行初始化。
比如在宣告變數 a
的同時將其初始化為 5:
int a = 5;
也可以宣告後再初始化:
int a;
a = 5;
如果不初始化,那麼變數的值將是難以想象的。
指標也是變數,也必須對其進行初始化。先執行下面一段程式碼:
int *p;
*p = 5;
return 0;
這段程式碼的意思很簡單:宣告一個指標 p
, 將 5 賦值給指標 p
所指向的那個變數。但這種程式碼是錯誤的!
請問指標 p
指向了誰?由於我們沒有對其進行初始化,所以根本就不知道指標 p
指向了誰,那怎麼賦值?
這就好比一個人對你說:“請把這個包裹給李四”。但是你根本就不知道李四是誰,李四住在哪裡,你怎麼給?
快遞員不認識你就能送貨,那是因為包裹上有地址,這就足夠了。
但是在上面的程式碼中,你告訴 p
地址了嗎?沒有!因為我們沒有對指標進行初始化!
所以初始化指標非常重要!!!未初始化的指標不能用!!!
更改如下:
int a = 4;
int *p = &a;
*p = 5;
或者:
int a = 4;
int *p;
p = &a;
*p = 5;
現在變數 a
的值由 4 變為 5 了。
因為我們在“包裹”上寫了變數
a
地址,所以能把 5 送給變數a
。
賦值
我們可以將一個指標賦值給另外一個指標。
int a = 5;
int *p1 = &a;
int *p2;
p2 = p1;
我們將指標 p1
的值賦給 p2
,然後列印以下內容:
printf("a = %d\n", a);
printf("&a = %p\n", &a);
printf("p1 = %p\n", p1);
printf("p2 = %p\n", p2);
printf("*p1 = %d\n", *p1);
printf("*p2 = %d\n", *p2);
printf("&p1 = %p\n", &p1);
printf("&p2 = %p\n", &p2);
輸出為:
a = 5
&a = 0061FF1C
p1 = 0061FF1C
p2 = 0061FF1C
*p1 = 5
*p2 = 5
&p1 = 0061FF18
&p2 = 0061FF14
可以看到,將指標 p1
賦值給另一個指標 p2
的結果是: p1
指向哪裡, p2
就指向哪裡。如此一來,我們可以通過兩個指標操作變數 a
。
*p1 = 4;
printf("a = %d\n", a); //從5變為4
*p2 = 3;
printf("a = %d\n", a); //從4變為3
空指標
空指標的值為 NULL
, 表示不指向任何物件。
int *p = NULL;
當我們初始化一個指標的時候,如果還不知道要指向誰的時候,就把它初始化為空指標。
一些用法
我們已經以”指向變數的指標”為例,介紹了指標的基本用法。現在介紹一些指標的其他用法。
指向指標的指標
前面我們介紹了“指向變數的指標”:
int a = 5;
int *pa = &5;
指標也是個變數,只不過相對於其他型別的變數有點特殊,指標變數中儲存的是其他變數的地址。
也就是說,指標作為一個變數也有地址,該地址可以被其他指標儲存,即指向了指標的指標。
對應程式碼如下:
int a = 5;
int *pa = &5;
int **ppa = &pa;
如你所見,宣告一個“指向指標的指標”需要使用兩個*
:
[pointer_type] **[pointer_name];
同樣地,要獲取 指向指標的指標 指向的 指標 指向的 變數值 需要進行兩次間接訪問,即**ppa
。
請仔細體會以下程式碼:
#include <stdio.h>
int main()
{
int a = 5;
int *pa = &a;
int **ppa = &pa;
printf("a = %d\n", a);
printf("&a = %p\n", &a);
printf("pa = %p\n", pa);
printf("*pa = %d\n", *pa);
printf("&pa = %p\n", &pa);
printf("ppa = %p\n", ppa);
printf("*ppa = %p\n", *ppa);
printf("**ppa = %d\n", **ppa);
printf("&ppa = %p\n", &ppa);
return 0;
}
通過程式碼,我們可以得到以下等價關係:
表示式 | 等價表示式 |
---|---|
a |
5 |
pa |
&a |
ppa |
&pa |
*pa |
a 、5 |
*ppa |
pa 、&a |
**ppa |
*pa 、a 、5 |
舉一反三,你還可以試試 {指向[指向(指標)的指標]的指標}。
指標和陣列
首先執行以下程式碼:
int arr[5] = {1, 2, 3, 4, 5};
printf("arr = %p\n", arr);
int *p = &arr[0];
printf("&arr[0] = %p\n", &arr[0]);
printf("p = %p\n", p);
printf("arr[0] = %d\n", arr[0]);
printf("*p = %d\n", *p);
p++;
printf("執行p++之後...\n");
printf("&arr[1] = %p\n", &arr[1]);
printf("p = %p\n", p);
printf("arr[1] = %d\n", arr[1]);
printf("*p = %d\n", *p);
輸出為:
arr = 0061FF08
&arr[0] = 0061FF08
p = 0061FF08
arr[0] = 1
*p = 1
執行p++之後...
&arr[1] = 0061FF0C
p = 0061FF0C
arr[1] = 2
*p = 2
可以得到以下結論:
arr
=&arr[0]
,arr
是陣列的首元素指標int *p = &arr[0]
和int *p = arr
是等效的arr[n]
和*(p+n)
是等效的
指標和函式
先執行以下函式:
#include <stdio.h>
void swap(int x, int y)
{
int temp = x;
x = y;
y = temp;
}
int main()
{
int x = 5, y = 10;
printf("交換前 x = %d, y = %d\n", x, y);
swap(x, y);
printf("交換後 x = %d, y = %d\n", x, y);
return 0;
}
swap
函式的目的很簡單:傳進來兩個值,交換他們。
但是結果令人失望——根本沒交換。原因是什麼?
我們列印一些東西:
#include <stdio.h>
void swap(int x, int y)
{
printf("在swap()中,x的地址為%p,y的地址為%p\n", &x, &y);
printf("swap() 交換前 x = %d, y = %d\n", x, y);
int temp = x;
x = y;
y = temp;
printf("swap() 交換後 x = %d, y = %d\n", x, y);
}
int main()
{
int x = 5, y = 10;
printf("在main()中,x的地址為%p,y的地址為%p\n", &x, &y);
printf("main() 交換前 x = %d, y = %d\n", x, y);
swap(x, y);
printf("main() 交換後 x = %d, y = %d\n", x, y);
return 0;
}
輸出為:
在main()中,x的地址為0061FF1C,y的地址為0061FF18
main() 交換前 x = 5, y = 10
在swap()中,x的地址為0061FF00,y的地址為0061FF04
swap() 交換前 x = 5, y = 10
swap() 交換後 x = 10, y = 5
main() 交換後 x = 5, y = 10
可以看到,在 swap()
中,我們確實交換了值,但是swap()
函式執行完後回到 main()
中,值卻沒有交換。
可以看到,swap()
中的 x
、y
和 main()
中的 x
、y
的地址並不相同,這就意味著**此 x
、y
非彼 x
、y
**。
原因很簡單,swap(int x, int y) 的引數傳遞為值傳遞,所謂值傳遞,即將實參的值複製到形參的對應記憶體單元中。函式操作的是形參的記憶體單元,無論形參如何變化,都不會影響到實參。
void swap(int x, int y) //xy為形參
{.....}
int main()
{
int x = 5, y = 10;
swap(x, y); //xy為實參
}
這裡就解釋了為什麼 main()
和 swap()
列印出來的 x
、y
的地址不同,也解釋了為什麼交換失敗。
那麼,為了通過函式直接操作實參,我們必須使形參和實參是同一塊記憶體。所以我們直接把實參的地址傳給函式,也即,函式的引數為指標,指向實參的記憶體單元。這種引數傳遞為地址傳遞。
地址傳遞保證了形參的變化即為實參的變化。
程式碼更正:
#include <stdio.h>
void swap(int *px, int *py) //形參為指標,接收實參的地址
{
printf("在swap()中,px = %p,py = %p\n", px, py);
printf("swap() 交換前 x = %d, y = %d\n", *px, *py);
int temp = *px;
*px = *py;
*py = temp;
printf("swap() 交換後 x = %d, y = %d\n", *px, *py);
}
int main()
{
int x = 5, y = 10;
printf("在main()中,x的地址為%p,y的地址為%p\n", &x, &y);
printf("main() 交換前 x = %d, y = %d\n", x, y);
swap(&x, &y);
printf("main() 交換後 x = %d, y = %d\n", x, y);
return 0;
}
輸出為:
在main()中,x的地址為0061FF1C,y的地址為0061FF18
main() 交換前 x = 5, y = 10
在swap()中,px = 0061FF1C,py = 0061FF18
swap() 交換前 x = 5, y = 10
swap() 交換後 x = 10, y = 5
main() 交換後 x = 10, y = 5
指標和結構體
先定義一個結構體:
typedef struct Node {
int data;
struct Node *next;
} Node;
然後宣告一個結構體:
Node node;
要訪問結構體內的成員,需要使用 .
操作符:
node.data;
node.next;
現在我們有一個指向該結構體的指標:
Node *p = &node;
想要通過指標訪問結構體的成員:
(*p).data;
(*p).next;
也可以使用 ->
操作符:
p->data;
p->next;
注意,->
要對指向結構體的指標使用才行。
對於初學者,某個概念一時搞不懂其實很正常。誰都不是一下子就學會用筷子和走路的,我們需要的是花時間進行大量的實踐。就拿指標來說吧,初學者覺得難以理解是因為用得少,反過來說,對於經常使用 C/C++ 寫程式碼的人,指標肯定早就不是問題了。所以搞清基本原理,接下來就花時間去大量實踐吧,時間到了,自然就會豁然開朗。
如有錯誤,還請指正。
如果覺得寫的不錯可以關注一下我。