Windows+GCC下記憶體對齊的常見問題

空明流轉發表於2013-11-27

原文網址 : https://www.cnblogs.com/lingjingqiu/p/3446457.html

結構/類對齊的宣告方式

gcc和windows對於modifier/attribute的支援其實是差不多的。比如在gcc的例子中，記憶體對齊要寫成：

class X
{
  //...
} __attribute__((aligned(16)));

但是實際上你寫成

class __attribute__((aligned(16))) X 
{
    /*...*/
};

gcc一樣可以識別。這樣MSVC和gcc就可以使用巨集完成跨平臺編譯。

對齊型別的變數在堆與棧上的分配

對齊在以下場合都能提示編譯器為它的變數分配對齊的地址：

void foo()
{
    X v; // v是個棧上的16位元組對齊的變數
    X* p = new X; // p是堆上的16位元組對齊的指標
    X* a = new X[ARRAY_SIZE]; // 那麼這個呢？
}

棧上的變數堆上分配出的變數，因為align這個hint的存在，都能滿足16位元組對齊的要求。但是陣列呢？按照一般規律來分析，對齊後的sizeof(X)，一定是對齊的整數倍。比如16位元組對齊的話，那麼X的大小隻能是16的倍數。所以對於本例的陣列而言，編譯器應該也能知道a應該是16位元組對齊的。

但是事實上挺奇怪。在MSVC上，p和a都很好的遵守了對齊的要求；在gcc上，p是對齊的，但是a卻不是。其實這個問題在2004年便有人提出來，只是到目前為止一直都沒有人動手過。當然，標準也沒有規定X的陣列就一定是要對齊的。要解決這個問題，要麼過載class的operator new/delete，要麼用memalign/aligned_malloc分配出對齊的記憶體，再placement new。出於易用性，我選擇的是操作符過載。

clang對於對齊的支援更乾脆：16B的對齊已經夠用了。所以align完全被編譯器忽視了。結果Intel出來了AVX，Clang就傻逼了。不知道這個問題3.4會不會修正。

編譯器如何實現記憶體對齊

MSVC在x86下預設是支援的4B的記憶體對齊。也就是說在函式入口處，ESP和EBP只保證是4位元組對齊的。這時，當前函式域棧上變數的地址都是ESP + 4 * x的形式。如果函式體內有對齊的變數，例如：

void foo()
{
    int __declspec(align(16)) x;
    // ...
}

那麼編譯器在程式碼生成時，會在函式的前部插入一段稱為prolog的程式碼，這段程式碼會將堆疊修正為16B對齊，比如

PUSH EBP
MOV  EBP, ESP
SUB  ESP, XXX
AND  ESP, 0xFFFFFFF0h

這樣ESP就一定是16位元組對齊的。這個時候給x分配的地址，就可以是ESP + 0x10 * n的形式，這樣就滿足了對齊的需要。

在GCC上，gcc認為所有的函式都有義務在呼叫其它函式的時候，ESP是16位元組對齊的（當然，可以通過編譯選項修改這一要求）。不光是呼叫方會這樣保證，被呼叫方也是這樣預設的。所以GCC為了呼叫效率更高一點，便根據呼叫方的假設，去掉了“堆疊修正”這個步驟。

原來的程式碼可能就變成了

PUSH EBP             ; 假設這裡的ESP是16B對齊的，Push了EBP，ESP就是16x-4了。
MOV  EBP, ESP
SUB  ESP, 0x0000023Ch ; 減完以後這裡又是16位元組對齊了

那麼當被呼叫方遵守這個約定的時候，ESP當然就是16位元組對齊的。但是有一種情況例外。在MinGW下，執行緒的入口函式是被API回撥的。這個函式很可能是按照Windows的標準4個位元組對齊的。這樣，在沒有堆疊修正的情況下，整個執行緒呼叫鏈16B對齊的默契就被打破了。如果這個時候出現了SSE程式碼試圖存取“16位元組對齊”的變數，那可能就會發生segment fault的異常，因為這些變數的地址並不是對齊的。

解決這個問題，有兩種常見的辦法：第一，寫一個Wrapper函式，對齊ESP後轉發呼叫；第二，使用編譯選項-mstackrealign。這個選項會為所有函式增加堆疊修正的PROLOG程式碼，以保證函式棧幀一定是按照16位元組或使用者指定大小對齊。

Java記憶體模型常見問題
2019-02-03
Java記憶體模型
C結構體中資料的記憶體對齊問題
2018-08-20
結構體記憶體
記憶體對齊
2024-03-18
記憶體
GO 記憶體對齊
2020-11-21
Go記憶體
理解記憶體對齊
2020-11-06
記憶體
react 記憶體洩露常見問題解決方案
2019-04-03
React記憶體洩露
JVM記憶體管理面試常見問題全解
2022-04-16
JVM記憶體面試
結構體記憶體對齊
2020-11-21
結構體記憶體
JVM 常見線上問題 → CPU 100%、記憶體洩露問題排查
2020-10-09
JVM記憶體洩露
C# 記憶體對齊
2024-10-06
C#記憶體
iOS 記憶體位元組對齊
2019-05-12
iOS記憶體
C語言記憶體對齊
2024-10-02
C語言記憶體
一個SMMU記憶體訪問異常的問題
2024-08-10
記憶體
JavaScript 工作原理之三－記憶體管理及如何處理 4 類常見的記憶體洩漏問題(譯)
2019-03-04
JavaScript記憶體
C++ struct結構體記憶體對齊
2022-03-22
C++Struct結構體記憶體
c 結構體記憶體對齊詳解
2021-04-13
結構體記憶體
struct結構體大小的計算(記憶體對齊)
2021-10-09
Struct結構體記憶體
iOS探索記憶體對齊&malloc原始碼
2020-01-02
iOS記憶體原始碼
C/C++記憶體對齊原則
2023-02-05
C++記憶體
C/C++記憶體對齊詳解
2021-01-19
C++記憶體
Angular 伺服器端渲染應用一個常見的記憶體洩漏問題
2022-05-19
Angular伺服器記憶體
記憶體吞金獸(Elasticsearch)的那些事兒 -- 常見問題痛點及解決方案
2021-08-25
記憶體Elasticsearch
5個常見的JavaScript記憶體錯誤
2021-12-31
JavaScript記憶體
Netty原始碼解析 -- 記憶體對齊類SizeClasses
2020-11-22
Netty原始碼記憶體
IE下記憶體增漲明顯的問題
2019-03-29
記憶體
Dig101:Go 之聊聊 struct 的記憶體對齊
2020-02-14
GoStruct記憶體
記憶體對齊巨集定義的簡明解釋
2022-01-28
記憶體
從 CPU 角度理解 Go 中的結構體記憶體對齊
2022-01-20
Go結構體記憶體
域名解析常見問題（下）
2022-10-24
#pragma pack記憶體對齊的實現以及相關微軟面試題
2020-11-13
記憶體微軟面試題
composer使用常見問題記錄
2019-02-16
Android常見記憶體洩漏總結
2019-02-14
Android記憶體
【譯】JavaScript的工作原理：記憶體管理和4種常見的記憶體洩漏
2018-12-19
JavaScript記憶體
排查Java的記憶體問題
2018-03-13
Java記憶體
對於記憶體洩漏問題的簡單認知
2019-04-16
記憶體
C語言中結構體struct的對齊問題
2019-03-25
C語言結構體Struct
【JVM故障問題排查心得】「記憶體診斷系列」JVM記憶體與Kubernetes中pod的記憶體、容器的記憶體不一致所引發的OOMKilled問題總結（下）
2022-12-01
JVM記憶體OOM
常見問題
2024-12-06
嵌入式產品常見記憶體概念
2024-03-10
記憶體

Windows+GCC下記憶體對齊的常見問題

結構/類對齊的宣告方式

對齊型別的變數在堆與棧上的分配

編譯器如何實現記憶體對齊

相關文章