C語言結構體大小分析

劉?發表於2023-04-05
title: C語言結構體大小分析
author: saopigqwq233
date: 2022-04-05

C語言結構體大小分析

一,基本型別

C語言自帶的資料型別大小如下

資料型別 大小(位元組)
char 1
short 2
int 4
long 4或8
float 4
double 8
long double 16

二,自定義型別---struct

C語言除了以上這些基本型別,還支援使用者自己定義資料型別

類似於一下形式:

struct Student{
    char name[10];//學生姓名
    int age;//學生年齡
};

這裡自定義了一個struct Student 型別的資料型別,包含有字元陣列整形兩種內容。

三,自定義結構體大小分析

1.錯誤示範

如果直接按照結構體內的成員型別相加,那麼如上struct Student型別的大小應該是

10+4=14

似乎沒什麼問題,但是,當我們用以下程式碼做測試時,卻發現出了問題

#include"stdio.h"
#include"stdlib.h"
struct Student{
    char name[10];//學生姓名
    int age;//學生年齡
};
int main()
{
    printf("%d\n",sizeof(struct Student));//測試struct Student大小
    system("pause");
    return 0;
}

執行結果

可以發現,結構體大小並非結構體成員大小簡單相加

為什麼會出現這樣的結果?這是因為C語言中存在一種行為叫結構體記憶體對齊。

2.記憶體對齊

結構體成員在記憶體存放時,編譯器會在結構體成員之間新增填充位元組,以保證結構體成員的對齊要求。

2.1對齊規則

1)結構體第一個成員永遠放在0偏移處

在C語言中,結構體第一個成員的地址和整個結構體的初始地址是相同的,也就是說,結構體的第一個成員始終位於結構體的初始地址處。

可以用以下程式碼證明:

#include"stdio.h"
#include"stdlib.h"
struct student {
    char name[20];
    int age;
    float score;
};
int main()
{
    struct student stu;
    printf("%p\n%p\n",&(stu),&(stu.name));
    system("pause");
    return 0;
}

執行結果如下(不同裝置上執行的數值可能不相同,但是一臺裝置上兩行的資料相同):

可以看到,結構體變數的地址和結構體變數第一個成員的地址是相同的。

2)從第二個成員開始,以後的每個成員的地址距離都要對齊到某個對齊數的整數倍處,這個對齊數是:(成員自身大小和預設對齊數)的較小值

這句話是什麼意思呢,讓我們先看一個例子:

#include"stdio.h"
struct S
{
    char a;
    int b;
    char c;
    long long d;
}s;//建立結構體變數s
int main()
{
    printf("結構體大小:%d\n",sizeof(struct S));
    printf("各個成員的地址:\n");
    printf("%p char a\n",&(s.a));
    printf("%p int b\n",&(s.b));
    printf("%p char c\n",&(s.c));
    printf("%p long long d",&(s.d));
    return 0;
}

執行結果如下:

需要注意的是,%p是以16進位制的格式進行輸出,最後一個long long 型資料d的大小為8位元組,則其結束地址應該是7d057

因此,結構體大小:7d057(16)-7d039(16)=18(16)=24(10)

接下來我們將以excel表格代表記憶體空間,分析每個成員在記憶體的分佈

其中,D列的0到23代表每個地址距離起始地址的偏移量

@1 首先是 char a,已知結構體第一個成員永遠放在0偏移處,且char 只佔1位元組,那麼a在記憶體的分佈暫時是這樣的

@2 接下來是int b,第二個成員要對齊到對齊數的整數倍,也就是說,它的起始地址的偏移量必須是對齊數的整數倍。

對齊數:1)資料型別自身的對齊數:char型資料自身對齊值為1位元組,short型資料為2位元組,int/float型為4位元組,double型為8位元組。

2)預設對齊數:VS2013預設對齊數為8,或#pragma pack (value)時的指定對齊值value。

3)資料成員、結構體的有效對齊數:自身對齊值和指定對齊值中較小者,即有效對齊值=min{自身對齊值,當前指定的pack值}。

*需要注意的是gcc無預設對齊數

由於我使用的是gcc編譯器,則int b的對齊數是其自身對齊值4,如果使用的是Visual Studio這個IDE,那麼其對齊數為min(4,8)=4

因此,編譯器將會在成員char a後再填補3個位元組,使int b對齊,記憶體分佈如下:

@3 接下來是char c,其對齊數是min(1,8)=1,大小是1位元組,那麼,直接接在偏移量為8的地方

@4 最後一個成員是long long d,對齊數是8,大小8位元組,則需要對齊到8*2=16這個偏移量的地址,並在char c佔用記憶體後填補7個位元組,記憶體分佈如下:

3)結構體大小是所有成員對齊數中最大對齊數的整數倍

當最後一個結構體成員存放後,如果結構體大小不是所有成員的對齊數中最大對齊數的整數倍,那麼會在結構體最後的成員後補位元組。

#include"stdio.h"
struct S{
    int a;
    char c;
}s;
int main()
{
    printf("%d struct S\n",sizeof(struct S));
    printf("%p int a\n",&(s.a));
    printf("%p char c\n",&(s.c));
    return 0;
}
return 0;
}

接下來我們分析結構體成員是如何分佈在記憶體中的

@1 首先是int a,對齊數為4,大小是4個位元組,由於是第一個成員,直接放在0偏移處

@2 其次是char c,對齊數為1,大小是一個位元組,則可以存放在偏移量為4的地方

@3 我們發現,如果結構體到這裡就分配結束,那麼結構體大小應該為5,但是實際情況卻是結構體大小為8。實際上結構體也要進行記憶體對齊。

此結構體中int a和char c的對齊數分別為4和1,結構體對齊數是成員對齊數中的最大對齊數,則此結構體對齊數大小MAX(4,1)=4,那麼,就需要在char c後填補位元組到結構體大小為8.

4)巢狀結構體中子結構體對齊到子結構體自己成員的最大對齊數的整數倍

@1 offsetof(type, member-designator) 求偏移量宏

此庫宏需要包含標頭檔案“stddef.h”,會生成一個型別為size_t的整形數,代表該成員在記憶體中距離起始地址的偏移量。

例項可參考:C 庫宏 – offsetof() | 菜鳥教程 (runoob.com)

話不多說,上程式碼:

#include"stdio.h"
#include"stddef.h"
struct stu{
    int name;
    double grades;
};
struct team{
    char name[6];
    struct stu Students;
    int num_stu;
};
int main()
{
    struct team Team;
    printf("%d struct stu\n",sizeof(struct stu));
    printf("%d struct team\n",sizeof(struct team));
    printf("%p char name[10]\n"
    "%p struct stu Students\n"
    "%p int num_stu\n",(Team.name),&(Team.Students),&(Team.num_stu));
    printf("%d struct stu Students\n%d int num_stu\n",offsetof(struct team,Students),offsetof(struct team,num_stu));
    return 0;
}

執行結果如下:

@2 根據上面三個規律,可以得出struct stu的大小是16,接下來我們看看struct team的成員是怎麼分佈的

@3 首先是char name[6],第一個成員直接佔用6位元組,我知道你們都懂?

@4 然後來到了我們的重頭戲,struct stu,首先,這個子結構體成員最大的對齊數是8(double),所以,需要對齊到偏移量為8的地方,符合offsetof(struct team,Students) 返回值為8的結果。因此,還需要在第一個成員後補兩個位元組,子結構體大小為16,佔用16個位元組

@5 最後一個成員int num_stu,佔用4個位元組,對齊數為4,24=4*6,所以對齊到24偏移量處。最後一個成員放進去後,結構體大小為28,不等於結構體對齊數(成員的最大對齊數)8的整數倍,所以,需要再最後一個成員後補上4個位元組,讓結構體大小為32=8*4.

2.2對齊數的設定

編譯時的預設對齊數可以透過#pragma pack(n) 來設定,它會影響結構體中每個成員的有效對齊值,有效對齊值是編譯器的對齊數和成員大小中較小的那個。例如,如果編譯器的對齊數是4,而結構體中有一個double型別的成員(佔8位元組),那麼該成員的有效對齊值是4,而不是8。

上程式碼:

@1 首先我們看看不帶#pragma pack(n)的:

#include"stdio.h"
#include"stdlib.h"
struct stu{
	int age;
	double grades;
};
int main()
{
	printf("%d\n",sizeof(struct stu));
	return 0;
}

先分析一下,int age佔用四個位元組,double grades對齊數為8,則需要補4個位元組到int age,double grades自己佔用8個位元組,所以結構體大小為16個位元組,看看執行結果吧:

果然如此,那加上prama pack(4) 呢。

@2 帶pragma pack(4)

上程式碼(其實只是多了一個#pragma pack(4)而已?):

#pragma pack(4)
#include"stdio.h"
#include"stdlib.h"
struct stu{
	int age;
	double grades;
};
int main()
{
	printf("%d\n",sizeof(struct stu));
	return 0;
}

執行結果:

現在編譯器對齊數為4。首先,int age佔用4個位元組,然後,double grades 對齊數=MIN(自己大小8,編譯器對齊數4)=4,所以不用在age後補位元組,grades直接從偏移量為4的地方開始。兩個成員放完後,結構體大小為12,結構體對齊數為MAX(成員們的對齊數)=4,12=4*3,則無需補位元組。


感謝你閱讀我的部落格,如果你對我的內容有任何的意見、建議或者問題,歡迎在評論區留言,我會盡快回復。如果你發現了我的錯誤或者疏漏,也請不吝指正,我會及時修改。希望我的部落格能對你有所幫助,也期待與你的交流和分享。

相關文章