概覽
指標是C語言的精髓,但是很多初學者往往對於指標的概念並不深刻,以至於學完之後隨著時間的推移越來越模糊,感覺指標難以掌握,本文通過簡單的例子試圖將指標解釋清楚,今天的重點有幾個方面:
什麼是指標
存放變數地址的變數我們稱之為“指標變數”,簡單的說變數p中儲存的是變數a的地址,那麼p就可以稱為是指標變數,或者說p指向a。當我們訪問a變數的時候其實是程式先根據a取得a對應的地址,再到這個地址對應的儲存空間中拿到a的值,這種方式我們稱之為“直接引用”;而當我們通過p取得a的時候首先要先根據p轉換成p對應的儲存地址,再根據這個地址到其對應的儲存空間中拿到儲存內容,它的內容其實就是a的地址,然後根據這個地址到對應的儲存空間中取得對應的內容,這個內容就是a的值,這種通過p找到a對應地址再取值的方式成為“間接引用”。這裡以表格形式列出a和p的儲存以幫助大家理解上面說的內容:
接下來,看一下指標的賦值
// // main.c // Point // // Created by Kenshin Cui on 14-7-05. // Copyright (c) 2014年 Kenshin Cui. All rights reserved. // #include <stdio.h> int main(int argc, const char * argv[]) { int a=1; int *p; p=&a; //也可以直接給指標變數賦值:int *p=&a; printf("address(a)=%x,address(p)=%x\n",&a,p); //結果:address(a)=5fbff81c,address(p)=5fbff81c printf("a=%d,p=%d\n",a,*p); //結果:a=1,p=1 *p=2; printf("a=%d,*p=%d\n",a,*p); //結果:a=2,p=2 int b=8; char c= 1; int *q=&c; printf("address(b)=%x,address(c)=%x\n",&b,&c);//結果: printf("c=%d,q=%d\n", c, *q); //結果:c=1,q=2049,為什麼q的值不是1呢? return 0; }
需要說明兩點:
a.int *p;中的*只是表示p變數是一個指標變數;而列印*p的時候,*p中的*是操作符,表示p指標指向的變數的儲存空間(當前儲存就是1),同時我們也看到了*p==a;修改了*p也就是修改了p指向的儲存空間的內容,也就修改了a,所以第二次列印a=2;
b.指標所指向的型別必須和定義指標時宣告的型別相同;上面指標q定義成了int型而指向了char型,結果輸出*q列印出了2049,具體原因見下圖(假設在16位編譯器下,指標長度為2位元組)
由於區域性變數是儲存在棧裡面的,所以先儲存b再儲存a、p,當列印*p的時候,其實就是以p指向的地址對應的空間開始取兩個位元組的資料(因為定義p的時候它指向的是int型,在16位編譯器下int型別的長度為2),剛好定義的b和c空間連續,所以就取到b的其中一個位元組,最後*p二進位制儲存為“0000100000000001”(見上圖黃色背景內容),十進位制表示就是2049;
c.指標變數佔用的空間和它所指向的變數型別無關,只跟編譯器位數有關(準確的說只跟定址方式有關);
陣列和指標
由於陣列的儲存是連續的,陣列名就是陣列的地址,這樣一來陣列和指標就有著很微妙的關係,先看以下例子:
// // main.c // Point // // Created by Kenshin Cui on 14-7-05. // Copyright (c) 2014年 Kenshin Cui. All rights reserved. // #include <stdio.h> void changeValue(int a[]){ a[0]=2; } void changeValue2(int *p){ p[0]=3; } int main(int argc, const char * argv[]) { int a[]={1,2,3}; int *p=&a[0]; //等價於:*p=a; printf("len=%lu\n",sizeof(int));//取得int長度為2 //指標加1代表地址向後挪動所指向型別的長度位(這裡型別是int,長度為2) //也就是說p指向a[0],p+1指向a[1],以此類推,所以我們通過指標也可以取出陣列元素 for(int i=0;i<3;++i){ //printf("a[%d]=%d\n",i,a[i]); printf("a[%d]=%d\n",i,*(p+i));//由於a就代表陣列的地址,其實這裡還可以寫成*(a+i),但是注意這裡*(p+i)可以寫成*(p++),但是*(a+i)不能寫成*(a++),因為陣列名是常量 } /*輸出結果: a[0]=1 a[1]=2 a[2]=3 */ changeValue(p); //等價於:changeValue(a) for(int i=0;i<3;++i){ printf("a[%d]=%d\n",i,a[i]); } /*輸出結果: a[0]=2 a[1]=2 a[2]=3 */ changeValue2(a); //等價於:changeValue2(p) for(int i=0;i<3;++i){ printf("a[%d]=%d\n",i,a[i]); } /*輸出結果: a[0]=3 a[1]=2 a[2]=3 */ return 0; }
從上面的例子我們可以得出如下結論:
- 陣列名a==&a[0]==*p;
- 如果p指向一個陣列,那麼p+1指向陣列的下一個元素,同時注意p+1移動的長度並不固定,具體需要根據p指向的資料型別而定;
- 指標可以寫成p++形式,但是陣列名不可以,因為陣列名是常量
- 不管函式的形參為陣列還是指標,實參都可以使用陣列名或指標;
擴充套件--字串和指標
由於在C語言中字串就是字元陣列,下面不妨看一下字串和陣列的關係:
// // main.c // Point // // Created by Kenshin on 14-7-05. // Copyright (c) 2014年 Kenshin Cui. All rights reserved. // #include <stdio.h> int main(int argc, const char * argv[]) { char a[]="Kenshin"; printf("%x,%s\n",a,a);//結果:5fbff820,Kenshin,同一個變數a是輸出字串還是輸出地址,根據格式引數而定 printf(a); //結果:Kenshin printf("\n"); char b[]="Kenshin"; char *p=b; printf("b=%s,p=%s\n",b,p);//結果:b=Kenshin,p=Kenshin //指標儲存的是地址,而陣列名儲存的也是地址,既然字元陣列可以表示字串,那麼指向字元的指標同樣也可以,如下方式可以更簡單的定義一個字串 char *c="Kenshin"; //等價於char c[]="Kenshin"; printf("c=%s\n",c); //結果:c=Kenshin return 0; }
以上程式碼中註釋基本已經很清楚了,這裡需要指出是為什麼printf(a)能夠直接輸出字串呢?
我們看一下printf()的定義:int printf(const char * __restrict, ...) __printflike(1, 2);
其實printf的引數要求是指向字元型別的指標,而結合上面的例子和我們之前說的,如果函式形參是指標型別那麼可以傳入函式名,因此也就能正確輸出字串的內容了。類似的還有上一篇文章中說的strcat()、strcpy()等函式均是如此。
函式指標
在弄清函式指標的問題之前,我們不妨先來看一下返回指標型別資料的函式,畢竟指標型別也是C語言的資料型別,下面以一個字串轉換為大寫字元的程式為例,在這個例子中不僅可以看到返回值為指標型別的函式同時還可以看到前面說到的指標移動操作:
// // main.c // Point // // Created by Kenshin Cui on 14-06-28. // Copyright (c) 2014年 Kenshin Cui. All rights reserved. // #include <stdio.h> char * toUpper(char *a){ char *b=a; //保留最初地址,因為後面的迴圈會改變字串最初地址 int len='a'-'A'; //大小寫ASCII碼差值相等 while (*a!='\0') { //字元是否結束 if(*a>'a'&&*a<'z'){//如果是小寫字元 *(a++) -= len; //*a表示陣列對應的字元(-32變為小寫),a++代表移動到下一個字元 } } return b; } int main(int argc, const char * argv[]) { char a[]="hello"; char *p=toUpper(a); printf("%s\n",p); //結果:HELLO return 0; }
大家都是知道函式只能有一個返回值,如果需要返回多個值,怎麼辦,其實很簡單,只要將指標作為函式引數傳遞就可以了,在下面的例子中我們再次看到指標作為引數進行傳遞。
// // main.c // Point // // Created by Kenshin Cui on 14-6-28. // Copyright (c) 2014年 Kenshin Cui. All rights reserved. // #include <stdio.h> int operate(int a,int b,int *c){ *c=a-b; return a+b; } int main(int argc, const char * argv[]) { int a=1,b=2,c,d; d=operate(a, b, &c); printf("a+b=%d,a-b=%d\n",d,c);//結果:a+b=3,a-b=-1 return 0; }
函式也是在記憶體中儲存的,當然函式也有一個起始地址(事實上函式名就是函式的起始地址),這裡同樣需要弄清函式指標的關係。函式指標定義的形式:返回值型別 (*指標變數名)(形參1,形參2),拿到函式指標其實我們就相當於拿到了這個函式,函式的操作都可以通過指標來完成,而且通過前面的例子可以看到指標作為C語言的資料型別,可以作為引數、作為返回值,那麼當然函式指標同樣可以作為函式的引數和返回值:
// // main.c // Point // // Created by Kenshin Cui on 14-6-28. // Copyright (c) 2014年 Kenshin Cui. All rights reserved. // #include <stdio.h> int sum(int a,int b){ return a+b; } int sub(int a,int b){ return a-b; } //函式指標作為引數進行傳遞 int operate(int a,int b,int (*p)(int,int)){ return p(a,b); } int main(int argc, const char * argv[]) { int a=1,b=2; int (*p)(int ,int)=sum;//函式名就是函式首地址,等價於:int (*p)(int,int);p=sum; int c=p(a,b); printf("a+b=%d\n",c); //結果:a+b=3 //函式作為引數傳遞 printf("%d\n",operate(a, b, sum)); //結果:3 printf("%d\n",operate(a, b, sub)); //結果:-1 return 0; }
函式指標可以作為函式引數進行傳遞,實在太強大了,是不是想起了C#中的委託?記得C#書籍中經常提到委託類似於函式指標,其實說的就是上面的情況。需要注意的是,普通的指標可以寫成p++進行移動,而函式指標寫成p++並沒有意義。