記憶體分配知識(全域性,區域性,靜態變數)

jiangzhengdong發表於2013-03-07

預備知識—程式的記憶體分配 

一個由C/C++編譯的程式佔用的記憶體分為以下幾個部分 
1、棧區(stack)— 由編譯器自動分配釋放 ,存放函式的引數值,區域性變數的值等。其操作方式類似於資料結構中的棧。 
2、堆區(heap) — 一般由程式設計師分配釋放, 若程式設計師不釋放,程式結束時可能由OS回收 。注意它與資料結構中的堆是兩回事,分配方式倒是類似於連結串列,呵呵。
3、全域性區(靜態區)(static)—,全域性變數和靜態變數的儲存是放在一塊的,初始化的全域性變數和靜態變數在一塊區域, 未初始化的全域性變數和未初始化的靜態變數在相鄰的另一塊區域。 - 程式結束後有系統釋放 
4、文字常量區 —常量字串就是放在這裡的。 程式結束後由系統釋放 
5、程式程式碼區—存放函式體的二進位制程式碼。

一個正常的程式在記憶體中通常分為程式段,資料端和堆疊三部分。程式段裡放著程式的機器碼和只讀資料,這個段通常是隻讀,對它的寫操作是非法的。資料段放的是程式中的靜態資料。動態資料則通過堆疊來存放。在記憶體中,它們的位置如下: 
+------------------+ 記憶體低端 
| 程式段 | 
|------------------| 
| 資料段 | 
|------------------| 
| 堆疊 | 
+------------------+ 記憶體高階 
堆疊是記憶體中的一個連續的塊。一個叫堆疊指標的暫存器(SP)指向堆疊的棧頂。堆疊的底部是一個固定地址。堆疊有一個特點就是,後進先出。也就是說,後放入的資料第一個取出。它支援兩個操作,PUSH和POP。PUSH是將資料放到棧的頂端,POP是將棧頂的資料取出。
在高階語言中,程式函式呼叫和函式中的臨時變數都用到堆疊。為什麼呢?因為在呼叫一個函式時,我們需要對當前的操作進行保護,也為了函式執行後,程式可以正確的找到地方繼續執行,所以引數的傳遞和返回值也用到了堆疊。通常對區域性變數的引用是通過給出它們對SP的偏移量來實現的。另外還有一個基址指標(FP,在Intel晶片中是BP),許多編譯器實際上是用它來引用本地變數和引數的。通常,引數的相對FP的偏移是正的,區域性變數是負的。 
當程式中發生函式呼叫時,計算機做如下操作:首先把引數壓入堆疊;然後儲存指令暫存器(IP)中的內容,做為返回地址(RET);第三個放入堆疊的是基址暫存器(FP);然後把當前的棧指標(SP)拷貝到FP,做為新的基地址;最後為本地變數留出一定空間,把SP減去適當的數值。 

在函式體中定義的變數通常是在棧上,用malloc, calloc, realloc等分配記憶體的函式分配得到的就是在堆上。在所有函式體外定義的是全域性量,加了static修飾符後不管在哪裡都存放在全域性區(靜態區),在所有函式體外定義的static變數表示在該檔案中有效,不能extern到別的檔案用,在函式體內定義的static表示只在該函式體內有效。另外,函式中的"adgfdf"這樣的字串存放在常量區。

對比:
1 效能
棧:棧存在於RAM中。棧是動態的,它的儲存速度是第二快的。stack
堆:堆位於RAM中,是一個通用的記憶體池。所有的物件都儲存在堆中。heap

2 申請方式
stack: 由系統自動分配。 例如,宣告在函式中一個區域性變數 int b; 系統自動在棧中為b開闢空間 
heap: 需要程式設計師自己申請,並指明大小,在c中malloc函式 如p1 = (char *)malloc(10); 
在C++中用new運算子 如p2 = (char *)malloc(10); 但是注意p1、p2本身是在棧中的。

3 申請後系統的響應
棧:只要棧的剩餘空間大於所申請空間,系統將為程式提供記憶體,否則將報異常提示棧溢位。 
堆:首先應該知道作業系統有一個記錄空閒記憶體地址的連結串列,當系統收到程式的申請時, 
會遍歷該連結串列,尋找第一個空間大於所申請空間的堆結點,然後將該結點從空閒結點連結串列中刪除,並將該結點的空間分配給程式,另外,對於大多數系統,會在這塊記憶體空間中的首地址處記錄本次分配的大小,這樣,程式碼中的delete語句才能正確的釋放本記憶體空間。另外,由於找到的堆結點的大小不一定正好等於申請的大小,系統會自動的將多餘的那部分重新放入空閒連結串列中。

4 申請大小的限制
棧:在Windows下,棧是向低地址擴充套件的資料結構,是一塊連續的記憶體的區域。這句話的意思是棧頂的地址和棧的最大容量是系統預先規定好的,在WINDOWS下,棧的大小是2M(也有的說是1M,總之是一個編譯時就確定的常數),如果申請的空間超過棧的剩餘空間時,將提示overflow。因此,能從棧獲得的空間較小。 
堆:堆是向高地址擴充套件的資料結構,是不連續的記憶體區域。這是由於系統是用連結串列來儲存的空閒記憶體地址的,自然是不連續的,而連結串列的遍歷方向是由低地址向高地址。堆的大小受限於計算機系統中有效的虛擬記憶體。由此可見,堆獲得的空間比較靈活,也比較大。

5 申請效率的比較
棧由系統自動分配,速度較快。但程式設計師是無法控制的。 
堆是由new分配的記憶體,一般速度比較慢,而且容易產生記憶體碎片,不過用起來最方便. 
另外,在WINDOWS下,最好的方式是用VirtualAlloc分配記憶體,他不是在堆,也不是在棧是直接在程式的地址空間中保留一快記憶體,雖然用起來最不方便。但是速度快,也最靈活。

6 堆和棧中的儲存內容
棧:在函式呼叫時,第一個進棧的是主函式中後的下一條指令(函式呼叫語句的下一條可執行語句)的地址,然後是函式的各個引數,在大多數的C編譯器中,引數是由右往左入棧的,然後是函式中的區域性變數。注意靜態變數是不入棧的。 
當本次函式呼叫結束後,區域性變數先出棧,然後是引數,最後棧頂指標指向最開始存的地址,也就是主函式中的下一條指令,程式由該點繼續執行。 
堆:一般是在堆的頭部用一個位元組存放堆的大小。堆中的具體內容有程式設計師安排。

7 存取效率的比較
char s1[] = "aaaaaaaaaaaaaaa"; 
char *s2 = "bbbbbbbbbbbbbbbbb"; 
aaaaaaaaaaa是在執行時刻賦值的; 
而bbbbbbbbbbb是在編譯時就確定的; 
但是,在以後的存取中,在棧上的陣列比指標所指向的字串(例如堆)快。 
比如: 
#include 
void main() 

char a = 1; 
char c[] = "1234567890"; 
char *p ="1234567890"; 
a = c[1]; 
a = p[1]; 
return; 

對應的彙編程式碼 
10: a = c[1]; 
00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh] 
0040106A 88 4D FC mov byte ptr [ebp-4],cl 
11: a = p[1]; 
0040106D 8B 55 EC mov edx,dword ptr [ebp-14h] 
00401070 8A 42 01 mov al,byte ptr [edx+1] 
00401073 88 45 FC mov byte ptr [ebp-4],al 
第一種在讀取時直接就把字串中的元素讀到暫存器cl中,而第二種則要先把指標值讀到edx中,在根據edx讀取字元,顯然慢了。 

小結: 
堆和棧的區別可以用如下的比喻來看出: 
使用棧就象我們去飯館裡吃飯,只管點菜(發出申請)、付錢、和吃(使用),吃飽了就走,不必理會切菜、洗菜等準備工作和洗碗、刷鍋等掃尾工作,他的好處是快捷,但是自由度小。 
使用堆就象是自己動手做喜歡吃的菜餚,比較麻煩,但是比較符合自己的口味,而且自由度大。

全域性變數、靜態資料、常量存放在全域性資料區,所有函式的程式碼存放在程式碼區,為執行函式而分配的區域性變數、函式引數、返回資料、返回地址等存放在棧區。   
所以在同一個程式裡,多個任務(執行緒)的全域性變數和靜態變數都應該是共享同一塊記憶體(全域性資料區)   
而在不同的程式裡,重新載入了程式碼,各個程式間的全域性變數和靜態變數當然不是擁有同一塊記憶體。   
在psos下,各個任務是不同的執行緒,所以各個任務的全域性變數和靜態變數是在同一塊記憶體。而我的另一個程式中(在sco unix),是每次執行都是一個新的程式,所以各個程式的全域性變數和靜態變數擁有不同的記憶體


轉自:http://www.cppblog.com/elva/archive/2009/10/30/99811.html

相關文章