聊聊C語言和指標的本質

dog250發表於2020-02-03

坐著綠皮車上海到杭州,24塊錢,很寬敞,在火車上非正式地聊幾句。


很多程式語言都以 “沒有指標” 作為自己的優勢來宣傳,然而,對於C語言,指標卻是與生俱來的。

那麼,什麼是指標,為什麼大家都想避開指標。

很簡單, 指標就是地址,當一個地址作為一個變數存在時,它就被叫做指標,該變數的型別,自然就是指標型別。

指標的作用就是,給出一個指標,取出該指標指向地址處的值。為了理解本質,我們從計算機模型說起。

巨集觀看來,計算機可以分為兩類:

  1. 儲存-執行計算機。
    這類機器典型的例子就是我們平時使用的計算機,有一個CPU,有一個記憶體,CPU僅包含運算邏輯,所有的指令和資料都在記憶體中,記憶體僅供儲存,不包含任何運算元件。
  2. 現場程式設計計算機。
    這類機器的典型例子就是ASCI電路,FPGA這種。直接針對特定的需求構建邏輯電路,然而,由於存在笛卡爾積的問題,不太適合通用計算。

我們看我們平時使用的儲存-執行模型的計算機工作模式:

  • CPU在地址匯流排上發射一個地址到記憶體。
  • 記憶體把特定地址對應的資料返回到資料匯流排。

看起來,通用計算機就是通過指標完成所有工作的。CPU沒有能力直接操作記憶體裡的值,它必須做以下的操作以迂迴:

  1. 從特定地址A0取出值V0。
  2. 對V0進行加工運算生成V1。
  3. 將V1存入特定地址A1。

太初,人們就是按照以上的這麼個邏輯程式設計的,這就是組合語言:

mov    -0x4c(%rbp),%ebx

然而,這樣太麻煩了,C語言隨著簡單通用的UNIX作業系統而生,下面的語句看起來更加方便:

int a = 10;
char *p = &a;
*p = 13;

C語言直接對映了CPU的工作方式,而且是用極其簡單的方式,這就是C語言的藝術。

這就是C指標的背景。在那個年代,人們還沒有渴望計算機幫助完成更復雜的業務邏輯,人們只是希望用一種更加簡單的方式抽象出計算機的行為,最終的結晶,就是C語言。

於是,我們說,C語言的精華就是指標,指標是C語言的一切。我們可以沒有if-else語言,我們可以沒有switch-case語句,我們可以不要while,我們不要for,但我們必須有指標。

是的,我們可以用指標函式的狀態矩陣代替if-else之類:

int (*routine)[...]();
...
condition = calc(...);
routine[condition](argv);

我們用狀態矩陣成功規避了if-else…可以看到,還是用的指標。


指標是儲存-執行模型的計算機工作的必要條件!

我們再看儲存-執行模型的計算機的工作方式:

  • 給定一個地址,CPU就可以取出該地址的資料。
  • 給定一個地址,CPU就可以寫入該地址一個值。

這意味著什麼?

只要想讓CPU正常工作,就必須暴露整個記憶體地址空間給CPU,否則CPU就是一堆毫無用處的閘電路,換句話說, 一切來自記憶體! 操作記憶體就必然要用指標!


其實,C語言就是簡化版的組合語言。最終,C語言接力彙編用指標創造了世界。

不管怎麼樣,C語言是面向計算機的程式語言,而不是面向業務的程式語言,它對映了計算機的工作方式而不太善於描述業務邏輯,因此,C語言深受黑客,程式設計手藝人這種計算機本身的愛好者喜愛,卻不被業務程式設計師待見,因為擺弄指標確實太繁瑣複雜了,一不小心就會出錯。

儲存-執行模型的問題在於,要設計複雜的帶外機制防止記憶體被任意訪問,由此而來的就是複雜的分段,分頁,訪問控制,MMU等機制,當然,這些機制和CPU依靠指標訪問記憶體的工作方式並不衝突。

把C語言指標用的最絕的應該就是Linux核心的嵌入式連結串列 struct list_head 了:

struct list_head {
	struct list_head *next, *prev;
};

它可以代表一切,它通過C指標完美詮釋了OOD,list_head是世界的基類!

通過container_of巨集,list_head可以轉換為任意物件:

/**
 * container_of - cast a member of a structure out to the containing structure
 * @ptr:        the pointer to the member.
 * @type:       the type of the container struct this is embedded in.
 * @member:     the name of the member within the struct.
 *
 */
#define container_of(ptr, type, member) ({                              \
        void *__mptr = (void *)(ptr);                                   \
        BUILD_BUG_ON_MSG(!__same_type(*(ptr), ((type *)0)->member) &&   \
                         !__same_type(*(ptr), void),                    \
                         "pointer type mismatch in container_of()");    \
        ((type *)(__mptr - offsetof(type, member))); })

這個轉換背後的依賴,正是指標:
在這裡插入圖片描述

然而,C語言依然對業務程式設計不友好,前面說了,C語言對映的就是計算機工作方式本身,若想用好C語言,就必須要懂計算機原理,這並不是業務程式設計師的菜,業務程式設計師只是編寫業務邏輯,並不在乎計算機是如何工作的。

曾經,計算機還是一群痴迷於技術本身的極客們的玩具,計算機是屬於他們的,他們用C程式設計,用Perl/Python/Bash粘合二進位制程式。進入網際網路時代,隨著越來越複雜的業務邏輯出現,越來越多的職業程式設計師開始成了多數派,他們開始使用更加業務友好的語言,Java,Go便成功了。

不能說這些業務程式語言沒有指標,只是它們隱藏了指標而已,它們對程式設計師暴露了更加對業務友好的程式設計介面和語法,自己在底層處理指標問題,僅此而已。指標是客觀存在的,只要你使用的是儲存-執行模型的計算機,指標就是一切。


浙江溫州皮鞋溼,下雨進水不會胖。

相關文章