C++中泛型使用導致的膨脹問題

臨峰不畏發表於2016-03-22

前幾天，博主看了一篇文章抨擊C++的泛型會導致生成的可執行檔案程式碼臃腫。

博主從事C++軟體開發多年，由於之前的開發環境都是資源充足的伺服器，不用考慮磁碟空間的問題。最近打算在智慧家居主機的嵌入式平臺上使用C++進行開發。FLASH儲存空間有限，這是必須要考慮的因素，一定要重視。

如下定義兩個list，元素型別不同：

list<int> l1;
list<string> l2;

如果是用C語來做應該怎麼辦？它會對應list<int>寫一套程式碼，再對list<string>寫一套。每套都有相同的成員函式，只是變數型別各自不同罷了。

下面是list<int>的C語言實現方式：

//! code-1
struct list_int_item {
    int value;
    struct list_int_item *next;
};

struct list_int {
    struct list_int_item *head;
    size_t size;
};

void list_int_insert(struct list_int *p, int value);
int  list_int_sort(struct list_int *p);
bool list_int_empty(struct list_int *p);
...

下面是list<string>的C語言實現方式：

//! code-2
struct list_string_item {
    string value;
    struct list_string_item *next;
};

struct list_string {
    struct list_string_item *head;
    size_t size;
};

void list_string_insert(struct list_int *p, string value);
int  list_string_sort(struct list_int *p);
bool list_string_empty(struct list_int *p);
...

兩者之間就是型別的差別。所以很多時間，在C語言中我們就用巨集來替代它的型別，如下：

//! code-3
#define LIST_DECLARE(TYPE) \
    struct list_##TYPE##_item { \
        TYPE## value; \
        struct list_##TYPE##_item *next; \
    }; \
    \
    struct list_##TYPE { \
        struct list_##TYPE##_item *head; \
        size_t size; \
    }; \
    \
    void list_##TYPE##_insert(struct list_##TYPE *p, ##TYPE## value); \
    int  list_##TYPE##_sort(struct list_##TYPE *p); \
    bool list_##TYPE##_empty(struct list_##TYPE *p); \
    ...

然後在標頭檔案中是這樣定義list<double>的：

//! code-4

LIST_DECLARE(double)

所以，泛型產生冗餘程式碼是無法避免的，至少用C來做這樣的泛型也是無法避免的。

既然無法避免的，那就看看怎麼儘可能以避免上述的問題。在《Effective C++》中有一章節專門提到：不要在模板中使用不必要的引數。因為每一個不同的引數編譯器都會為之生成一套相應的程式碼。

如果程式碼中只有一種資料型別，就算用該型別定義了多個變數，編譯器是不是隻會生成一套相關的程式碼？（應該是這樣的）。

寫個例子對比一下：（省略不必要的程式碼）

test1.cpp，裡面只有map<int, string>，但定義了m1, m2, m3。

//! code-5

    map<int, string> m1;
    map<int, string> m2;
    map<int, string> m3;

    m1.insert(std::make_pair(1, "hello"));
    m2.insert(std::make_pair(1, "hi"));
    m3.insert(std::make_pair(1, "lichunjun"));

test2.cpp，與test1.cpp相比，裡面有三個型別：

//! code-6

    map<int, string> m1;
    map<int, double> m2;
    map<int, int> m3;

    m1.insert(std::make_pair(1, "hello"));
    m2.insert(std::make_pair(1, 1.2));
    m3.insert(std::make_pair(1, 44));

結果，編譯出來的可執行檔案大小比較：

[hevake_lcj@Hevake tmp]$ ll test1 test2
-rwxrwxr-x. 1 18784 Mar 19 22:01 test1
-rwxrwxr-x. 1 35184 Mar 19 22:03 test2

test2比test1大一倍，原因不用多說。

還有一個問題：指標是不是被認為是一個型別？

上面的list<int>與list<string>不能共用同一套程式碼，根據的原因是因為int與string這兩種型別在空間大小與賦值的方式上都是不同的。所以，必須生成兩套程式碼來實現。

而指標，不管是什麼指標，它們都是一樣的。我們可以用void*代表所有的指標型別。

於是我們將上面的程式碼改改，再測試一下：

//! code-7

    map<int, string*> m1;
    map<int, string*> m2;
    map<int, string*> m3;

    m1.insert(std::make_pair(1, new string("hello")));
    m2.insert(std::make_pair(1, new string("hi")));
    m3.insert(std::make_pair(1, new string("lichunjun")));

與

//! code-8

    map<int, string*> m1;
    map<int, double*> m2;
    map<int, int*> m3;

    m1.insert(std::make_pair(1, new string("hello")));
    m2.insert(std::make_pair(1, new double(1.2)));
    m3.insert(std::make_pair(1, new int(44)));

結果是這樣的：

-rwxrwxr-x. 1 18736 Mar 19 23:05 test1
-rwxrwxr-x. 1 35136 Mar 19 23:05 test2

預期的結果test1與test2相差不多，但從結果上看並沒有什麼優化，結果有點令人失望～

思考：C++有沒有什麼引數可以優化這個？

如果沒有，為了節省空間，我們只能將所有的指標統一定義成void*型別了，在使用時再強制轉換。

//! code-9

    map<int, void*> m1;
    map<int, void*> m2;
    map<int, void*> m3;

    m1.insert(std::make_pair(1, new string("hello")));
    m2.insert(std::make_pair(1, new double(1.2)));
    m3.insert(std::make_pair(1, new int(44)));

    cout << *static_cast<string*>(m1[1]) << endl;
    cout << *static_cast<double*>(m2[1]) << endl;
    cout << *static_cast<int*>(m3[1]) << endl;

如上程式碼是將code-8的基礎上，將所有的指定都定義成了void*，在使用的時候用static_cast進行強制轉換成對應的指標型別。

如此得到的程式碼大小與code-7的比較，只多了16個位元組。

但這種做法是很不可取的，必須用void*指標之後，編譯器不再對型別進行檢查，很容易把型別搞混淆。

最好還是編譯器支援指標泛型的優化吧！

PostgreSQL-亂序插入資料導致索引膨脹
2021-07-17
SQL索引
解決 jacoco 合併體積無限膨脹的問題
2024-03-21
Synchronized鎖及其膨脹
2022-04-22
synchronized
表膨脹的查詢方法
2022-01-04
c++臨時物件導致的生命週期問題
2024-07-09
C++物件
golang slice使用不慎導致的問題
2018-05-24
Golang
shell 中的 set -e 導致的退出問題
2020-09-25
opencv 影像腐蝕、影像的膨脹
2020-06-07
OpenCV
Java泛型型別擦除問題
2022-05-17
Java泛型型別
未使用 `deleteLater` 而直接使用 `delete` 導致問題
2024-11-16
delete
膨脹的template class成員函式
2019-05-11
函式
你是哪家的鎖，這麼膨脹
2021-08-30
Double型別數值相加導致精度缺失問題
2024-03-26
型別
web前端面試題：20道做完信心嫉妒膨脹的測試題
2021-04-19
Web前端面試題
ANALYZE導致的阻塞問題分析
2020-08-17
15個問題告訴你如何使用Java泛型
2021-04-28
Java泛型
[java][鎖]java鎖的膨脹和優化
2019-02-22
Java優化
synchronized的實現原理——鎖膨脹過程
2020-09-12
synchronized
面試中Java泛型問題一文搞定
2020-12-27
面試Java泛型
HarmonyOS 專案中泛型的使用
2024-04-25
泛型
在https中引入http資源所導致的問題
2018-12-24
HTTP
Java中泛型的詳細解析，深入分析泛型的使用方式
2021-08-09
Java泛型
C++泛型一：模板
2024-10-31
C++泛型
當「SPA」應用遇上了膨脹的專案
2018-12-18
使用資料庫處理併發可能導致的問題
2019-02-01
資料庫
【epoll問題】EPOLLRDHUP使用導致無法接受資料
2018-09-05
CAS導致的ABA問題及解決
2019-04-24
分散式鎖導致的超賣問題
2024-08-20
分散式
MySQL8.0 view導致的效能問題
2022-05-26
MySqlView
泛型物件的使用
2024-04-21
泛型物件
做完這20道前端面試題，你定會瞬間膨脹
2020-08-13
前端面試題
泛型類、泛型方法、型別萬用字元的使用
2019-03-29
泛型型別字元
react-router4：解決使用browserRouter模式導致的404問題
2019-01-17
React模式
Elasticsearch 使用不同分詞器導致搜尋排名的問題
2020-11-30
Elasticsearch分詞
c++使用遇到的問題
2020-12-16
C++
Kotlin中的泛型
2018-11-08
Kotlin泛型
Java中的泛型
2024-09-16
Java泛型
記一次crontab中date命令錯用導致的問題
2019-11-18
由於基本資料型別使用姿勢不對導致的線上"死迴圈"問題排查
2018-12-02
資料型別

C++中泛型使用導致的膨脹問題

相關文章