C++模板超程式設計

亮亮的園子發表於2015-01-22

實驗平臺:Win7,VS2013 Community,GCC 4.8.3(線上版)

所謂超程式設計就是編寫直接生成或操縱程式的程式,C++ 模板給 C++ 語言提供了超程式設計的能力,模板使 C++ 程式設計變得異常靈活,能實現很多高階動態語言才有的特性(語法上可能比較醜陋,一些歷史原因見下文)。普通使用者對 C++ 模板的使用可能不是很頻繁,大致限於泛型程式設計,但一些系統級的程式碼,尤其是對通用性、效能要求極高的基礎庫(如 STL、Boost)幾乎不可避免的都大量地使用 C++ 模板,一個稍有規模的大量使用模板的程式,不可避免的要涉及超程式設計(如型別計算)。本文就是要剖析 C++ 模板超程式設計的機制。

下面所給的所有程式碼,想做實驗又懶得開啟編譯工具?一個線上執行 C++ 程式碼的網站(GCC 4.8)很好~

1. C++模板的語法

函式模板(function template)和類别範本(class template)的簡單示例如下:

#include <iostream>

// 函式模板
template<typename T>
bool equivalent(const T& a, const T& b){
    return !(a < b) && !(b < a);
}
// 類别範本
template<typename T=int> // 預設引數
class bignumber{
    T _v;
public:
    bignumber(T a) : _v(a) { }
    inline bool operator<(const bignumber& b) const; // 等價於 (const bignumber<T> b)
};
// 在類别範本外實現成員函式
template<typename T>
bool bignumber<T>::operator<(const bignumber& b) const{
    return _v < b._v;
}

int main()
{
    bignumber<> a(1), b(1); // 使用預設引數,"<>"不能省略
    std::cout << equivalent(a, b) << '\n'; // 函式模板引數自動推導
    std::cout << equivalent<double>(1, 2) << '\n';
    std::cin.get();    return 0;
}

程式輸出如下:

1
0

關於模板(函式模板、類别範本)的模板引數(詳見文獻[1]第3章):

  • 型別引數(type template parameter),用 typename 或 class 標記;
  • 非型別引數(non-type template parameter)可以是:整數及列舉型別、物件或函式的指標、物件或函式的引用、物件的成員指標,非型別引數是模板例項的常量;
  • 模板型引數(template template parameter),如“template<typename T, template<typename> class A> someclass {};”;
  • 模板引數可以有預設值(函式模板引數預設是從 C++11 開始支援);
  • 函式模板的和函式引數型別有關的模板引數可以自動推導,類别範本引數不存在推導機制;
  • C++11 引入變長模板引數,請見下文。

模板特例化(template specialization,又稱特例、特化)的簡單示例如下:

// 實現一個向量類
template<typename T, int N>
class Vec{
    T _v[N];
    // ... // 模板通例(primary template),具體實現
};
template<>
class Vec<lt;float, 4>{
    float _v[4];
    // ... // 對 Vec<float, 4> 進行專門實現,如利用向量指令進行加速
};
template<int N>
class Vec<bool, N>{
    char _v[(N+sizeof(char)-1)/sizeof(char)];
    // ... // 對 Vec<bool, N> 進行專門實現,如用一個位元位表示一個bool
};

所謂模板特例化即對於通例中的某種或某些情況做單獨專門實現,最簡單的情況是對每個模板引數指定一個具體值,這成為完全特例化(full specialization),另外,可以限制模板引數在一個範圍取值或滿足一定關係等,這稱為部分特例化(partial specialization),用數學上集合的概念,通例模板引數所有可取的值組合構成全集U,完全特例化對U中某個元素進行專門定義,部分特例化對U的某個真子集進行專門定義。

更多模板特例化的例子如下(參考了文獻[1]第44頁):

template<typename T, int i> class cp00; // 用於模板型模板引數
// 通例
template<typename T1, typename T2, int i, template<typename, int> class CP>
class TMP;
// 完全特例化
template<>
class TMP<int, float, 2, cp00>;
// 第一個引數有const修飾
template<typename T1, typename T2, int i, template<typename, int> class CP>
class TMP<const T1, T2, i, CP>;
// 第一二個引數為cp00的例項且滿足一定關係,第四個引數為cp00
template<typename T, int i>
class TMP<cp00<T, i>, cp00<T, i+10>, i, cp00>;
// 編譯錯誤!,第四個引數型別和通例型別不一致
//template<template<int i> CP>
//class TMP<int, float, 10, CP>;

關於模板特例化(詳見文獻[1]第4章):

  • 在定義模板特例之前必須已經有模板通例(primary template)的宣告;
  • 模板特例並不要求一定與通例有相同的介面,但為了方便使用(體會特例的語義)一般都相同;
  • 匹配規則,在模板例項化時如果有模板通例、特例加起來多個模板版本可以匹配,則依據如下規則:對版本AB,如果 A 的模板引數取值集合是B的真子集,則優先匹配 A,如果 AB 的模板引數取值集合是“交叉”關係(AB 交集不為空,且不為包含關係),則發生編譯錯誤,對於函式模板,用函式過載分辨(overload resolution)規則和上述規則結合並優先匹配非模板函式。

對模板的多個例項,型別等價(type equivalence)判斷規則(詳見文獻[2] 13.2.4):同一個模板(模板名及其引數型別列表構成的模板簽名(template signature)相同,函式模板可以過載,類别範本不存在過載)且指定的模板實參等價(型別引數是等價型別,非型別引數值相同)。如下例子:

#include <iostream>
// 識別兩個型別是否相同,提前進入模板超程式設計^_^
template<typename T1, typename T2> // 通例,返回 false
class theSameType       { public: enum { ret = false }; };
template<typename T>               // 特例,兩型別相同時返回 true
class theSameType<T, T> { public: enum { ret = true }; };

template<typename T, int i> class aTMP { };

int main(){
    typedef unsigned int uint; // typedef 定義型別別名而不是引入新型別
    typedef uint uint2;
    std::cout << theSameType<unsigned, uint2>::ret << '\n';
    // 感謝 C++11,連續角括號“>>”不會被當做流輸入符號而編譯錯誤
    std::cout << theSameType<aTMP<unsigned, 2>, aTMP<uint2, 2>>::ret << '\n';
    std::cout << theSameType<aTMP<int, 2>, aTMP<int, 3>>::ret << '\n';
    std::cin.get(); return 0;
}
1
1
0

關於模板例項化(template instantiation)(詳見文獻[4]模板):

  • 指在編譯或連結時生成函式模板或類别範本的具體例項原始碼,即用使用模板時的實參型別替換模板型別引數(還有非型別引數和模板型引數);
  • 隱式例項化(implicit instantiation):當使用例項化的模板時自動地在當前程式碼單元之前插入模板的例項化程式碼,模板的成員函式一直到引用時才被例項化;
  • 顯式例項化(explicit instantiation):直接宣告模板例項化,模板所有成員立即都被例項化;
  • 例項化也是一種特例化,被稱為例項化的特例(instantiated (or generated) specialization)。

隱式例項化時,成員只有被引用到才會進行例項化,這被稱為推遲例項化(lazy instantiation),由此可能帶來的問題如下面的例子(文獻[6],文獻[7]):

#include <iostream>

template<typename T>
class aTMP {
public:
    void f1() { std::cout << "f1()\n"; }
    void f2() { std::ccccout << "f2()\n"; } // 敲錯鍵盤了,語義錯誤:沒有 std::ccccout
};

int main(){
    aTMP<int> a;
    a.f1();
    // a.f2(); // 這句程式碼被註釋時,aTMP<int>::f2() 不被例項化,從而上面的錯誤被掩蓋!
    std::cin.get(); return 0;
}

所以模板程式碼寫完後最好寫個諸如顯示例項化的測試程式碼,更深入一些,可以插入一些模板呼叫程式碼使得編譯器及時發現錯誤,而不至於報出無限長的錯誤資訊。另一個例子如下(GCC 4.8 下編譯的輸出資訊,VS2013 編譯輸出了 500 多行錯誤資訊):

#include <iostream>

// 計算 N 的階乘 N!
template<int N>
class aTMP{
public:
    enum { ret = N==0 ? 1 : N * aTMP<N-1>::ret }; // Lazy Instantiation,將產生無限遞迴!
};

int main(){
    std::cout << aTMP<10>::ret << '\n';
    std::cin.get(); return 0;
}
sh-4.2# g++ -std=c++11 -o main *.cpp
main.cpp:7:28: error: template instantiation depth exceeds maximum of 900 (use -ftemplate-depth= to increase the maximum) instantiating 'class aTMP<-890>'
  enum { ret = N==0 ? 1 : N * aTMP<N-1>::ret };
                            ^
main.cpp:7:28:   recursively required from 'class aTMP<9>'
main.cpp:7:28:   required from 'class aTMP<10>'
main.cpp:11:23:   required from here

main.cpp:7:28: error: incomplete type 'aTMP<-890>' used in nested name specifier

上面的錯誤是因為,當編譯 aTMP<N> 時,並不判斷 N==0,而僅僅知道其依賴 aTMP<N-1>(lazy instantiation),從而產生無限遞迴,糾正方法是使用模板特例化,如下:

#include <iostream>

// 計算 N 的階乘 N!
template<int N>
class aTMP{
public:
    enum { ret = N * aTMP<N-1>::ret };
};
template<>
class aTMP<0>{
public:
    enum { ret = 1 };
};

int main(){
    std::cout << aTMP<10>::ret << '\n';
    std::cin.get(); return 0;
}
3228800

關於模板的編譯和連結(詳見文獻[1] 1.3、文獻[4]模板):

  • 包含模板編譯模式:編譯器生成每個編譯單元中遇到的所有的模板例項,並存放在相應的目標檔案中;連結器合併等價的模板例項,生成可執行檔案,要求例項化時模板定義可見,不能使用系統連結器;
  • 分離模板編譯模式(使用 export 關鍵字):不重複生成模板例項,編譯器設計要求高,可以使用系統連結器;
  • 包含編譯模式是主流,C++11 已經棄用 export 關鍵字(對模板引入 extern 新用法),一般將模板的全部實現程式碼放在同一個標頭檔案中並在用到模板的地方用 #include 包含標頭檔案,以防止出現例項不一致(如下面緊接著例子);

例項化,編譯連結的簡單例子如下(參考了文獻[1]第10頁):

// file: a.cpp
#include <iostream>
template<typename T>
class MyClass { };
template MyClass<double>::MyClass(); // 顯示例項化建構函式 MyClass<double>::MyClass()
template class MyClass<long>;        // 顯示例項化整個類 MyClass<long>

template<typename T>
void print(T const& m) { std::cout << "a.cpp: " << m << '\n'; }

void fa() {
    print(1);   // print<int>,隱式例項化
    print(0.1); // print<double>
}
void fb(); // fb() 在 b.cpp 中定義,此處宣告

int main(){
    fa();
    fb();
    std::cin.get(); return 0;
}
// file: b.cpp
#include <iostream>
template<typename T>
void print(T const& m) { std::cout << "b.cpp: " << m << '\n'; }

void fb() {
    print('2'); // print<char>
    print(0.1); // print<double>
}
a.cpp: 1
a.cpp: 0.1
b.cpp: 2
a.cpp: 0.1

上例中,由於 a.cpp 和 b.cpp 中的 print<double> 例項等價(模板例項的二進位制程式碼在編譯生成的物件檔案 a.obj、b.obj 中),故連結時消除了一個(消除哪個沒有規定,上面消除了 b.cpp 中的)。

關於 template、typename、this 關鍵字的使用(文獻[4]模板,文獻[5]):

  • 依賴於模板引數(template parameter,形式引數,實參英文為 argument)的名字被稱為依賴名字(dependent name),C++標準規定,如果解析器在一個模板中遇到一個巢狀依賴名字,它假定那個名字不是一個型別,除非顯式用 typename 關鍵字前置修飾該名字;
  • 和上一條 typename 用法類似,template 用於指明巢狀型別或函式為模板;
  • this 用於指定查詢基類中的成員(當基類是依賴模板引數的類别範本例項時,由於例項化總是推遲,這時不依賴模板引數的名字不在基類中查詢,文獻[1]第 166 頁)。

一個例子如下(需要 GCC 編譯,GCC 對 C++11 幾乎全面支援,VS2013 此處總是在基類中查詢名字,且函式模板前不需要 template):

#include <iostream>

template<typename T>
class aTMP{
public: typedef const T reType;
};

void f() { std::cout << "global f()\n"; }

template<typename T>
class Base {
public:
    template <int N = 99>
    void f() { std::cout << "member f(): " << N << '\n'; }
};

template<typename T>
class Derived : public Base<T> {
public:
    typename T::reType m; // typename 不能省略
    Derived(typename T::reType a) : m(a) { }
    void df1() { f(); }                       // 呼叫全域性 f(),而非想象中的基類 f()
    void df2() { this->template f(); }        // 基類 f<99>()
    void df3() { Base<T>::template f<22>(); } // 強制基類 f<22>()
    void df4() { ::f(); }                     // 強制全域性 f()
};

int main(){
    Derived<aTMP<int>> a(10);
    a.df1(); a.df2(); a.df3(); a.df4();
    std::cin.get(); return 0;
}
global f()
member f(): 99
member f(): 22
global f()

C++11 關於模板的新特性(詳見文獻[1]第15章,文獻[4]C++11)

  • “>>” 根據上下文自動識別正確語義;
  • 函式模板引數預設值;
  • 變長模板引數(擴充套件 sizeof…() 獲取引數個數);
  • 模板別名(擴充套件 using 關鍵字);
  • 外部模板例項(擴充 extern 關鍵字),棄用 export template。

在本文中,如無特別宣告將不使用 C++11 的特性(除了 “>>”)。

 

2. 模板超程式設計概述

如果對 C++ 模板不熟悉(光熟悉語法還不算熟悉),可以先跳過本節,往下看完例子再回來。

C++ 模板最初是為實現泛型程式設計設計的,但人們發現模板的能力遠遠不止於那些設計的功能。一個重要的理論結論就是:C++ 模板是圖靈完備的(Turing-complete),其證明過程請見文獻[8](就是用 C++ 模板模擬圖靈機),理論上說 C++ 模板可以執行任何計算任務,但實際上因為模板是編譯期計算,其能力受到具體編譯器實現的限制(如遞迴巢狀深度,C++11 要求至少 1024,C++98 要求至少 17)。C++ 模板超程式設計是“意外”功能,而不是設計的功能,這也是 C++ 模板超程式設計語法醜陋的根源。

C++ 模板是圖靈完備的,這使得 C++ 成為兩層次語言(two-level languages,中文暫且這麼翻譯,文獻[9]),其中,執行編譯計算的程式碼稱為靜態程式碼(static code),執行執行期計算的程式碼稱為動態程式碼(dynamic code),C++ 的靜態程式碼由模板實現(預處理的巨集也算是能進行部分靜態計算吧,也就是能進行部分超程式設計,稱為巨集超程式設計,見 Boost 超程式設計庫即 BCCL,文獻[16]和文獻[1] 10.4)。

具體來說 C++ 模板可以做以下事情:編譯期數值計算、型別計算、程式碼計算(如迴圈展開),其中數值計算實際不太有意義,而型別計算和程式碼計算可以使得程式碼更加通用,更加易用,效能更好(也更難閱讀,更難除錯,有時也會有程式碼膨脹問題)。編譯期計算在編譯過程中的位置請見下圖(取自文獻[10]),可以看到關鍵是模板的機制在編譯具體程式碼(模板例項)前執行:

C++ 模板超程式設計

從程式設計範型(programming paradigm)上來說,C++ 模板是函數語言程式設計(functional programming),它的主要特點是:函式呼叫不產生任何副作用(沒有可變的儲存),用遞迴形式實現迴圈結構的功能。C++ 模板的特例化提供了條件判斷能力,而模板遞迴巢狀提供了迴圈的能力,這兩點使得其具有和普通語言一樣通用的能力(圖靈完備性)。

程式設計形式來看,模板的“<>”中的模板引數相當於函式呼叫的輸入引數,模板中的 typedef 或 static const 或 enum 定義函式返回值(型別或數值,數值僅支援整型,如果需要可以通過編碼計算浮點數),程式碼計算是通過型別計算進而選擇型別的函式實現的(C++ 屬於靜態型別語言,編譯器對型別的操控能力很強)。程式碼示意如下:

#include <iostream>

template<typename T, int i=1>
class someComputing {
public:
    typedef volatile T* retType; // 型別計算
    enum { retValume = i + someComputing<T, i-1>::retValume }; // 數值計算,遞迴
    static void f() { std::cout << "someComputing: i=" << i << '\n'; }
};
template<typename T> // 模板特例,遞迴終止條件
class someComputing<T, 0> {
public:
    enum { retValume = 0 };
};

template<typename T>
class codeComputing {
public:
    static void f() { T::f(); } // 根據型別呼叫函式,程式碼計算
};

int main(){
    someComputing<int>::retType a=0;
    std::cout << sizeof(a) << '\n'; // 64-bit 程式指標
    // VS2013 預設最大遞迴深度500,GCC4.8 預設最大遞迴深度900(-ftemplate-depth=n)
    std::cout << someComputing<int, 500>::retValume << '\n'; // 1+2+...+500
    codeComputing<someComputing<int, 99>>::f();
    std::cin.get(); return 0;
}
8
125250
someComputing: i=99

C++ 模板超程式設計概覽框圖如下(取自文獻[9]):

C++ 模板超程式設計概覽

下面我們將對圖中的每個框進行深入討論。

 

3. 編譯期數值計算

第一個 C++ 模板元程式是 Erwin Unruh 在 1994 年寫的(文獻[14]),這個程式計算小於給定數 N 的全部素數(又叫質數),程式並不執行(都不能通過編譯),而是讓編譯器在錯誤資訊中顯示結果(直觀展現了是編譯期計算結果,C++ 模板超程式設計不是設計的功能,更像是在戲弄編譯器,當然 C++11 有所改變),由於年代久遠,原來的程式用現在的編譯器已經不能編譯了,下面的程式碼在原來程式基礎上稍作了修改(GCC 4.8 下使用 -fpermissvie,只顯示警告資訊):

// Prime number computation by Erwin Unruh
template<int i> struct D { D(void*); operator int(); }; // 建構函式引數為 void* 指標

template<int p, int i> struct is_prime { // 判斷 p 是否為素數,即 p 不能整除 2...p-1
    enum { prim = (p%i) && is_prime<(i>2?p:0), i-1>::prim };
};
template<> struct is_prime<0, 0> { enum { prim = 1 }; };
template<> struct is_prime<0, 1> { enum { prim = 1 }; };

template<int i> struct Prime_print {
    Prime_print<i-1> a;
    enum { prim = is_prime<i, i-1>::prim };
    // prim 為真時, prim?1:0 為 1,int 到 D<i> 轉換報錯;假時, 0 為 NULL 指標不報錯
    void f() { D<i> d = prim?1:0; a.f(); } // 呼叫 a.f() 例項化 Prime_print<i-1>::f()
};
template<> struct Prime_print<2> { // 特例,遞迴終止
    enum { prim = 1 };
    void f() { D<2> d = prim?1:0; }
};

#ifndef LAST
#define LAST 10
#endif

int main() {
    Prime_print<LAST> a; a.f(); // 必須呼叫 a.f() 以例項化 Prime_print<LAST>::f()
}
sh-4.2# g++ -std=c++11 -fpermissive -o main *.cpp
main.cpp: In member function 'void Prime_print<2>::f()':
main.cpp:17:33: warning: invalid conversion from 'int' to 'void*' [-fpermissive]
  void f() { D<2> d = prim ? 1 : 0; }
                                 ^
main.cpp:2:28: warning:   initializing argument 1 of 'D<i>::D(void*) [with int i = 2]' [-fpermissive]
 template<int i> struct D { D(void*); operator int(); };
                            ^
main.cpp: In instantiation of 'void Prime_print<i>::f() [with int i = 7]':
main.cpp:13:36:   recursively required from 'void Prime_print<i>::f() [with int i = 9]'
main.cpp:13:36:   required from 'void Prime_print<i>::f() [with int i = 10]'
main.cpp:25:27:   required from here
main.cpp:13:33: warning: invalid conversion from 'int' to 'void*' [-fpermissive]
  void f() { D<i> d = prim ? 1 : 0; a.f(); }
                                 ^
main.cpp:2:28: warning:   initializing argument 1 of 'D<i>::D(void*) [with int i = 7]' [-fpermissive]
 template<int i> struct D { D(void*); operator int(); };
                            ^
main.cpp: In instantiation of 'void Prime_print<i>::f() [with int i = 5]':
main.cpp:13:36:   recursively required from 'void Prime_print<i>::f() [with int i = 9]'
main.cpp:13:36:   required from 'void Prime_print<i>::f() [with int i = 10]'
main.cpp:25:27:   required from here
main.cpp:13:33: warning: invalid conversion from 'int' to 'void*' [-fpermissive]
  void f() { D<i> d = prim ? 1 : 0; a.f(); }
                                 ^
main.cpp:2:28: warning:   initializing argument 1 of 'D<i>::D(void*) [with int i = 5]' [-fpermissive]
 template<int i> struct D { D(void*); operator int(); };
                            ^
main.cpp: In instantiation of 'void Prime_print<i>::f() [with int i = 3]':
main.cpp:13:36:   recursively required from 'void Prime_print<i>::f() [with int i = 9]'
main.cpp:13:36:   required from 'void Prime_print<i>::f() [with int i = 10]'
main.cpp:25:27:   required from here
main.cpp:13:33: warning: invalid conversion from 'int' to 'void*' [-fpermissive]
  void f() { D<i> d = prim ? 1 : 0; a.f(); }
                                 ^
main.cpp:2:28: warning:   initializing argument 1 of 'D<i>::D(void*) [with int i = 3]' [-fpermissive]
 template<int i> struct D { D(void*); operator int(); };

上面的編譯輸出資訊只給出了前一部分,雖然資訊很雜,但還是可以看到其中有 10 以內全部素數:2、3、5、7(已經加粗顯示關鍵行)。

到目前為止,雖然已經看到了階乘、求和等遞迴數值計算,但都沒涉及原理,下面以求和為例講解 C++ 模板編譯期數值計算的原理:

#include <iostream>

template<int N>
class sumt{
public: static const int ret = sumt<N-1>::ret + N;
};
template<>
class sumt<0>{
public: static const int ret = 0;
};

int main() {
    std::cout << sumt<5>::ret << '\n';
    std::cin.get(); return 0;
}
15

當編譯器遇到 sumt<5> 時,試圖例項化之,sumt<5> 引用了 sumt<5-1> 即 sumt<4>,試圖例項化 sumt<4>,以此類推,直到 sumt<0>,sumt<0> 匹配模板特例,sumt<0>::ret 為 0,sumt<1>::ret 為 sumt<0>::ret+1 為 1,以此類推,sumt<5>::ret 為 15。值得一提的是,雖然對使用者來說程式只是輸出了一個編譯期常量 sumt<5>::ret,但在背後,編譯器其實至少處理了 sumt<0> 到 sumt<5> 共 6 個型別。

從這個例子我們也可以窺探 C++ 模板超程式設計的函數語言程式設計範型,對比結構化求和程式:for(i=0,sum=0; i<=N; ++i) sum+=i; 用逐步改變儲存(即變數 sum)的方式來對計算過程進行程式設計,模板元程式沒有可變的儲存(都是編譯期常量,是不可變的變數),要表達求和過程就要用很多個常量:sumt<0>::ret,sumt<1>::ret,…,sumt<5>::ret 。函數語言程式設計看上去似乎效率低下(因為它和數學接近,而不是和硬體工作方式接近),但有自己的優勢:描述問題更加簡潔清晰(前提是熟悉這種方式),沒有可變的變數就沒有資料依賴,方便進行並行化。

 

4. 模板下的控制結構

模板實現的條件 if 和 while 語句如下(文獻[9]):

// 通例為空,若不匹配特例將報錯,很好的除錯手段(這裡是 bool 就無所謂了)
template<bool c, typename Then, typename Else> class IF_ { };
template<typename Then, typename Else>
class IF_<true, Then, Else> { public: typedef Then reType; };
template<typename Then, typename Else>
class IF_<false,Then, Else> { public: typedef Else reType; };

// 隱含要求: Condition 返回值 ret,Statement 有型別 Next
template<template<typename> class Condition, typename Statement>
class WHILE_ {
    template<typename Statement> class STOP { public: typedef Statement reType; };
public:
    typedef typename
        IF_<Condition<Statement>::ret,
        WHILE_<Condition, typename Statement::Next>,
        STOP<Statement>>::reType::reType
    reType;
};

IF_<> 的使用示例見下面:

const int len = 4;
typedef
    IF_<sizeof(short)==len, short,
    IF_<sizeof(int)==len, int,
    IF_<sizeof(long)==len, long,
    IF_<sizeof(long long)==len, long long,
    void>::reType>::reType>::reType>::reType
int_my; // 定義一個指定位元組數的型別
std::cout << sizeof(int_my) << '\n';
4

WHILE_<> 的使用示例見下面:

// 計算 1^e+2^e+...+n^e
template<int n, int e>
class sum_pow {
    template<int i, int e> class pow_e{ public: enum{ ret=i*pow_e<i,e-1>::ret }; };
    template<int i> class pow_e<i,0>{ public: enum{ ret=1 }; };
    // 計算 i^e,巢狀類使得能夠定義巢狀模板元函式,private 訪問控制隱藏實現細節
    template<int i> class pow{ public: enum{ ret=pow_e<i,e>::ret }; };
    template<typename stat>
    class cond { public: enum{ ret=(stat::ri<=n) }; };
    template<int i, int sum>
    class stat { public: typedef stat<i+1, sum+pow<i>::ret> Next;
                         enum{ ri=i, ret=sum }; };
public:
    enum{ ret = WHILE_<cond, stat<1,0>>::reType::ret };
};

int main() {
    std::cout << sum_pow<10, 2>::ret << '\n';
    std::cin.get(); return 0;
}
385

為了展現編譯期數值計算的強大能力,下面是一個更復雜的計算:最大公約數(Greatest Common Divisor,GCD)和最小公倍數(Lowest Common Multiple,LCM),經典的輾轉相除演算法:

// 最小公倍數,普通函式
int lcm(int a, int b){
    int r, lcm=a*b;
    while(r=a%b) { a = b; b = r; } // 因為用可變的儲存,不能寫成 a=b; b=a%b;
    return lcm/b;
}
// 遞迴函式版本
int gcd_r(int a, int b) { return b==0 ? a : gcd_r(b, a%b); } // 簡潔
int lcm_r(int a, int b) { return a * b / gcd_r(a,b); }

// 模板版本
template<int a, int b>
class lcm_T{
    template<typename stat>
    class cond { public: enum{ ret=(stat::div!=0) }; };
    template<int a, int b>
    class stat { public: typedef stat<b, a%b> Next; enum{ div=a%b, ret=b }; };
    static const int gcd = WHILE_<cond, stat<a,b>>::reType::ret;
public:
    static const int ret = a * b / gcd;
};
// 遞迴模板版本
template<int a, int b>
class lcm_T_r{
    template<int a, int b> class gcd { public: enum{ ret = gcd<b,a%b>::ret }; };
    template<int a> class gcd<a, 0> { public: enum{ ret = a }; };
public:
    static const int ret = a * b / gcd<a,b>::ret;
};

int main() {
    std::cout << lcm(100, 36) << '\n';
    std::cout << lcm_r(100, 36) << '\n';
    std::cout << lcm_T<100, 36>::ret << '\n';
    std::cout << lcm_T_r<100, 36>::ret << '\n';
    std::cin.get(); return 0;
}
900
900
900
900

上面例子中,定義一個類的整型常量,可以用 enum,也可以用 static const int,需要注意的是 enum 定義的常量的位元組數不會超過 sizeof(int) (文獻[2])。

 

5. 迴圈展開

文獻[11]展示了一個迴圈展開(loop unrolling)的例子 — 氣泡排序:

#include <utility>  // std::swap

// dynamic code, 普通函式版本
void bubbleSort(int* data, int n)
{
    for(int i=n-1; i>0; --i) {
        for(int j=0; j<i; ++j)
            if (data[j]>data[j+1]) std::swap(data[j], data[j+1]);
    }
}
// 資料長度為 4 時,手動迴圈展開
inline void bubbleSort4(int* data)
{
#define COMP_SWAP(i, j) if(data[i]>data[j]) std::swap(data[i], data[j])
    COMP_SWAP(0, 1); COMP_SWAP(1, 2); COMP_SWAP(2, 3);
    COMP_SWAP(0, 1); COMP_SWAP(1, 2);
    COMP_SWAP(0, 1);
}

// 遞迴函式版本,指導模板思路,最後一個引數是啞引數(dummy parameter),僅為分辨過載函式
class recursion { };
void bubbleSort(int* data, int n, recursion)
{
    if(n<=1) return;
    for(int j=0; j<n-1; ++j) if(data[j]>data[j+1]) std::swap(data[j], data[j+1]);
    bubbleSort(data, n-1, recursion());
}

// static code, 模板超程式設計版本
template<int i, int j>
inline void IntSwap(int* data) { // 比較和交換兩個相鄰元素
    if(data[i]>data[j]) std::swap(data[i], data[j]);
}

template<int i, int j>
inline void IntBubbleSortLoop(int* data) { // 一次冒泡,將前 i 個元素中最大的置換到最後
    IntSwap<j, j+1>(data);
    IntBubbleSortLoop<j<i-1?i:0, j<i-1?(j+1):0>(data);
}
template<>
inline void IntBubbleSortLoop<0, 0>(int*) { }

template<int n>
inline void IntBubbleSort(int* data) { // 模板氣泡排序迴圈展開
    IntBubbleSortLoop<n-1, 0>(data);
    IntBubbleSort<n-1>(data);
}
template<>
inline void IntBubbleSort<1>(int* data) { }

對迴圈次數固定且比較小的迴圈語句,對其進行展開並內聯可以避免函式呼叫以及執行迴圈語句中的分支,從而可以提高效能,對上述程式碼做如下測試,程式碼在 VS2013 的 Release 下編譯執行:

#include <iostream>
#include <omp.h>
#include <string.h> // memcpy

int main() {
    double t1, t2, t3; const int num=100000000;
    int data[4]; int inidata[4]={3,4,2,1};
    t1 = omp_get_wtime();
    for(int i=0; i<num; ++i) { memcpy(data, inidata, 4); bubbleSort(data, 4); }
    t1 = omp_get_wtime()-t1;
    t2 = omp_get_wtime();
    for(int i=0; i<num; ++i) { memcpy(data, inidata, 4); bubbleSort4(data); }
    t2 = omp_get_wtime()-t2;
    t3 = omp_get_wtime();
    for(int i=0; i<num; ++i) { memcpy(data, inidata, 4); IntBubbleSort<4>(data); }
    t3 = omp_get_wtime()-t3;
    std::cout << t1/t3 << '\t' << t2/t3 << '\n';
    std::cin.get(); return 0;
}
2.38643 0.926521

上述結果表明,模板超程式設計實現的迴圈展開能夠達到和手動迴圈展開相近的效能(90% 以上),並且效能是迴圈版本的 2 倍多(如果扣除 memcpy 函式佔據的部分加速比將更高,根據 Amdahl 定律)。這裡可能有人會想,既然迴圈次數固定,為什麼不直接手動迴圈展開呢,難道就為了使用模板嗎?當然不是,有時候迴圈次數確實是編譯期固定值,但對使用者並不是固定的,比如要實現數學上向量計算的類,因為可能是 2、3、4 維,所以寫成模板,把維度作為 int 型模板引數,這時因為不知道具體是幾維的也就不得不用迴圈,不過因為維度資訊在模板例項化時是編譯期常量且較小,所以編譯器很可能在程式碼優化時進行迴圈展開,但我們想讓這一切發生的更可控一些。

上面用三個函式模板 IntSwap<&ggt;()、 IntBubbleSortLoop<>()、 IntBubbleSort<>() 來實現一個排序功能,不但顯得分散(和封裝原理不符),還暴露了實現細節,我們可以仿照上一節的程式碼,將 IntBubbleSortLoop<>()、 IntBubbleSort<>() 嵌入其他模板內部,因為函式不允許巢狀,我們只能用類别範本:

// 整合成一個類别範本實現,看著好,但引入了 程式碼膨脹
template<int n>
class IntBubbleSortC {
    template<int i, int j>
    static inline void IntSwap(int* data) { // 比較和交換兩個相鄰元素
        if(data[i]>data[j]) std::swap(data[i], data[j]);
    }
    template<int i, int j>
    static inline void IntBubbleSortLoop(int* data) { // 一次冒泡
        IntSwap<j, j+1>(data);
        IntBubbleSortLoop<j<i-1?i:0, j<i-1?(j+1):0>(data);
    }
    template<>
    static inline void IntBubbleSortLoop<0, 0>(int*) { }
public:
    static inline void sort(int* data) {
        IntBubbleSortLoop<n-1, 0>(data);
        IntBubbleSortC<n-1>::sort(data);
    }
};
template<>
class IntBubbleSortC<0> {
public:
    static inline void sort(int* data) { }
};

int main() {
    int data[4] = {3,4,2,1};
    IntBubbleSortC<4>::sort(data); // 如此呼叫
    std::cin.get(); return 0;
}

上面程式碼看似很好,不僅整合了程式碼,藉助類成員的訪問控制,還隱藏了實現細節。不過它存在著很大問題,如果例項化 IntBubbleSortC<4>、 IntBubbleSortC<3>、 IntBubbleSortC<2>,將例項化成員函式 IntBubbleSortC<4>::IntSwap<0, 1>()、 IntBubbleSortC<4>::IntSwap<1, 2>()、 IntBubbleSortC<4>::IntSwap<2, 3>()、 IntBubbleSortC<3>::IntSwap<0, 1>()、 IntBubbleSortC<3>::IntSwap<1, 2>()、 IntBubbleSortC<2>::IntSwap<0, 1>(),而在原來的看著分散的程式碼中 IntSwap<0, 1>() 只有一個。這將導致程式碼膨脹(code bloat),即生成的可執行檔案體積變大(程式碼膨脹另一含義是原始碼增大,見文獻[1]第11章)。不過這裡使用了內聯(inline),如果編譯器確實內聯展開程式碼則不會導致程式碼膨脹(除了迴圈展開本身會帶來的程式碼膨脹),但因為重複編譯原本可以複用的模板例項,會增加編譯時間。在上一節的例子中,因為只涉及編譯期常量計算,並不涉及函式(函式模板,或類别範本的成員函式,函式被編譯成具體的機器二進位制程式碼),並不會出現程式碼膨脹。

為了清晰證明上面的論述,我們去掉所有 inline 並將函式實現放到類外面(類裡面實現的成員函式都是內聯的,因為函式實現可能被包含多次,見文獻[2] 10.2.9,不過現在的編譯器優化能力很強,很多時候加不加 inline 並不影響編譯器自己對內聯的選擇…),分別編譯分散版本和類别範本封裝版本的氣泡排序程式碼編譯生成的目標檔案(VS2013 下是 .obj 檔案)的大小,程式碼均在 VS2013 Debug 模式下編譯(防止編譯器優化),比較 main.obj (原始檔是 main.cpp)大小。

類别範本封裝版本程式碼如下,注意將成員函式在外面定義的寫法:

#include <iostream>
#include <utility>  // std::swap

// 整合成一個類别範本實現,看著好,但引入了 程式碼膨脹
template<int n>
class IntBubbleSortC {
    template<int i, int j> static void IntSwap(int* data);
    template<int i, int j> static void IntBubbleSortLoop(int* data);
    template<> static void IntBubbleSortLoop<0, 0>(int*) { }
public:
    static void sort(int* data);
};
template<>
class IntBubbleSortC<0> {
public:
    static void sort(int* data) { }
};

template<int n> template<int i, int j>
void IntBubbleSortC<n>::IntSwap(int* data) {
    if(data[i]>data[j]) std::swap(data[i], data[j]);
}
template<int n> template<int i, int j>
void IntBubbleSortC<n>::IntBubbleSortLoop(int* data) {
    IntSwap<j, j+1>(data);
    IntBubbleSortLoop<j<i-1?i:0, j<i-1?(j+1):0>(data);
}
template<int n>
void IntBubbleSortC<n>::sort(int* data) {
    IntBubbleSortLoop<n-1, 0>(data);
    IntBubbleSortC<n-1>::sort(data);
}

int main() {
    int data[40] = {3,4,2,1};
    IntBubbleSortC<2>::sort(data);  IntBubbleSortC<3>::sort(data);
    IntBubbleSortC<4>::sort(data);  IntBubbleSortC<5>::sort(data);
    IntBubbleSortC<6>::sort(data);  IntBubbleSortC<7>::sort(data);
    IntBubbleSortC<8>::sort(data);  IntBubbleSortC<9>::sort(data);
    IntBubbleSortC<10>::sort(data); IntBubbleSortC<11>::sort(data);
#if 0
    IntBubbleSortC<12>::sort(data); IntBubbleSortC<13>::sort(data);
    IntBubbleSortC<14>::sort(data); IntBubbleSortC<15>::sort(data);
    IntBubbleSortC<16>::sort(data); IntBubbleSortC<17>::sort(data);
    IntBubbleSortC<18>::sort(data); IntBubbleSortC<19>::sort(data);
    IntBubbleSortC<20>::sort(data); IntBubbleSortC<21>::sort(data);

    IntBubbleSortC<22>::sort(data); IntBubbleSortC<23>::sort(data);
    IntBubbleSortC<24>::sort(data); IntBubbleSortC<25>::sort(data);
    IntBubbleSortC<26>::sort(data); IntBubbleSortC<27>::sort(data);
    IntBubbleSortC<28>::sort(data); IntBubbleSortC<29>::sort(data);
    IntBubbleSortC<30>::sort(data); IntBubbleSortC<31>::sort(data);
#endif
    std::cin.get(); return 0;
}

分散定義函式模板版本程式碼如下,為了更具可比性,也將函式放在類裡面作為成員函式:

#include <iostream>
#include <utility>  // std::swap

// static code, 模板超程式設計版本
template<int i, int j>
class IntSwap {
public: static void swap(int* data);
};

template<int i, int j>
class IntBubbleSortLoop {
public: static void loop(int* data);
};
template<>
class IntBubbleSortLoop<0, 0> {
public: static void loop(int* data) { }
};

template<int n>
class IntBubbleSort {
public: static void sort(int* data);
};
template<>
class IntBubbleSort<0> {
public: static void sort(int* data) { }
};

template<int i, int j>
void IntSwap<i, j>::swap(int* data) {
    if(data[i]>data[j]) std::swap(data[i], data[j]);
}
template<int i, int j>
void IntBubbleSortLoop<i, j>::loop(int* data) {
    IntSwap<j, j+1>::swap(data);
    IntBubbleSortLoop<j<i-1?i:0, j<i-1?(j+1):0>::loop(data);
}
template<int n>
void IntBubbleSort<n>::sort(int* data) {
    IntBubbleSortLoop<n-1, 0>::loop(data);
    IntBubbleSort<n-1>::sort(data);
}

int main() {
    int data[40] = {3,4,2,1};
    IntBubbleSort<2>::sort(data);  IntBubbleSort<3>::sort(data);
    IntBubbleSort<4>::sort(data);  IntBubbleSort<5>::sort(data);
    IntBubbleSort<6>::sort(data);  IntBubbleSort<7>::sort(data);
    IntBubbleSort<8>::sort(data);  IntBubbleSort<9>::sort(data);
    IntBubbleSort<10>::sort(data); IntBubbleSort<11>::sort(data);
#if 0
    IntBubbleSort<12>::sort(data); IntBubbleSort<13>::sort(data);
    IntBubbleSort<14>::sort(data); IntBubbleSort<15>::sort(data);
    IntBubbleSort<16>::sort(data); IntBubbleSort<17>::sort(data);
    IntBubbleSort<18>::sort(data); IntBubbleSort<19>::sort(data);
    IntBubbleSort<20>::sort(data); IntBubbleSort<21>::sort(data);

    IntBubbleSort<22>::sort(data); IntBubbleSort<23>::sort(data);
    IntBubbleSort<24>::sort(data); IntBubbleSort<25>::sort(data);
    IntBubbleSort<26>::sort(data); IntBubbleSort<27>::sort(data);
    IntBubbleSort<28>::sort(data); IntBubbleSort<29>::sort(data);
    IntBubbleSort<30>::sort(data); IntBubbleSort<31>::sort(data);
#endif
    std::cin.get(); return 0;
}

程式中條件編譯都未開啟時(#if 0),main.obj 大小分別為 264 KB 和 211 KB,條件編譯開啟時(#if 1),main.obj 大小分別為 1073 KB 和 620 KB。可以看到,類别範本封裝版的物件檔案不但絕對大小更大,而且增長更快,這和之前分析是一致的。

 

6. 表示式模板,向量運算

文獻[12]展示了一個表示式模板(Expression Templates)的例子:

#include <iostream> // std::cout
#include <cmath>    // std::sqrt()

// 表示式型別
class DExprLiteral {                    // 文字量
    double a_;
public:
    DExprLiteral(double a) : a_(a) { }
    double operator()(double x) const { return a_; }
};
class DExprIdentity {                   // 自變數
public:
    double operator()(double x) const { return x; }
};
template<class A, class B, class Op>    // 雙目操作
class DBinExprOp {
    A a_; B b_;
public:
    DBinExprOp(const A& a, const B& b) : a_(a), b_(b) { }
    double operator()(double x) const { return Op::apply(a_(x), b_(x)); }
};
template<class A, class Op>             // 單目操作
class DUnaryExprOp {
    A a_;
public:
    DUnaryExprOp(const A& a) : a_(a) { }
    double operator()(double x) const { return Op::apply(a_(x)); }
};
// 表示式
template<class A>
class DExpr {
    A a_;
public:
    DExpr() { }
    DExpr(const A& a) : a_(a) { }
    double operator()(double x) const { return a_(x); }
};

// 運算子,模板引數 A、B 為參與運算的表示式型別
// operator /, division
class DApDiv { public: static double apply(double a, double b) { return a / b; } };
template<class A, class B> DExpr<DBinExprOp<DExpr<A>, DExpr<B>, DApDiv> >
operator/(const DExpr<A>& a, const DExpr<B>& b) {
    typedef DBinExprOp<DExpr<A>, DExpr<B>, DApDiv> ExprT;
    return DExpr<ExprT>(ExprT(a, b));
}
// operator +, addition
class DApAdd { public: static double apply(double a, double b) { return a + b; } };
template<class A, class B> DExpr<DBinExprOp<DExpr<A>, DExpr<B>, DApAdd> >
operator+(const DExpr<A>& a, const DExpr<B>& b) {
    typedef DBinExprOp<DExpr<A>, DExpr<B>, DApAdd> ExprT;
    return DExpr<ExprT>(ExprT(a, b));
}
// sqrt(), square rooting
class DApSqrt { public: static double apply(double a) { return std::sqrt(a); } };
template<class A> DExpr<DUnaryExprOp<DExpr<A>, DApSqrt> >
sqrt(const DExpr<A>& a) {
    typedef DUnaryExprOp<DExpr<A>, DApSqrt> ExprT;
    return DExpr<ExprT>(ExprT(a));
}
// operator-, negative sign
class DApNeg { public: static double apply(double a) { return -a; } };
template<class A> DExpr<DUnaryExprOp<DExpr<A>, DApNeg> >
operator-(const DExpr<A>& a) {
    typedef DUnaryExprOp<DExpr<A>, DApNeg> ExprT;
    return DExpr<ExprT>(ExprT(a));
}

// evaluate()
template<class Expr>
void evaluate(const DExpr<Expr>& expr, double start, double end, double step) {
    for(double i=start; i<end; i+=step) std::cout << expr(i) << ' ';
}

int main() {
    DExpr<DExprIdentity> x;
    evaluate( -x / sqrt( DExpr<DExprLiteral>(1.0) + x ) , 0.0, 10.0, 1.0);
    std::cin.get(); return 0;
}
-0 -0.707107 -1.1547 -1.5 -1.78885 -2.04124 -2.26779 -2.47487 -2.66667 -2.84605

程式碼有點長(我已經儘量壓縮行數),請先看最下面的 main() 函式,表示式模板允許我們以 “-x / sqrt( 1.0 + x )” 這種類似數學表示式的方式傳引數,在 evaluate() 內部,將 0-10 的數依次賦給自變數 x 對錶達式進行求值,這是通過在 template<> DExpr 類别範本內部過載 operator() 實現的。我們來看看這一切是如何發生的。

在 main() 中呼叫 evaluate() 時,編譯器根據全域性過載的加號、sqrt、除號、負號推斷“-x / sqrt( 1.0 + x )” 的型別是 Dexpr<DBinExprOp<Dexpr<DUnaryExprOp<Dexpr<DExprIdentity>, DApNeg>>, Dexpr<DUnaryExprOp<Dexpr<DBinExprOp<Dexpr<DExprLiteral>, Dexpr<DExprIdentity>, DApAdd>>, DApSqrt>>, DApDiv>>(即將每個表示式編碼到一種型別,設這個型別為 ultimateExprType),並用此型別例項化函式模板 evaluate(),型別的推導見下圖。在 evaluate() 中,對錶達式進行求值 expr(i),呼叫 ultimateExprType 的 operator(),這引起一系列的 operator() 和 Op::apply() 的呼叫,最終遇到基礎型別 “表示式型別” DExprLiteral 和 DExprIdentity,這個過程見下圖。總結就是,請看下圖,從下到上型別推斷,從上到下 operator() 表示式求值。

表示式模板,Expression Templates

上面程式碼函式實現寫在類的內部,即內聯,如果編譯器對內聯支援的好的話,上面程式碼幾乎等價於如下程式碼:

#include <iostream> // std::cout
#include <cmath>    // std::sqrt()

void evaluate(double start, double end, double step) {
    double _temp = 1.0;
    for(double i=start; i<end; i+=step)
        std::cout << -i / std::sqrt(_temp + i) << ' ';
}

int main() {
    evaluate(0.0, 10.0, 1.0);
    std::cin.get(); return 0;
}
-0 -0.707107 -1.1547 -1.5 -1.78885 -2.04124 -2.26779 -2.47487 -2.66667 -2.84605

和表示式模板類似的技術還可以用到向量計算中,以避免產生臨時向量變數,見文獻[4] Expression templates 和文獻[12]的後面。傳統向量計算如下:

class DoubleVec; // DoubleVec 過載了 + - * / 等向量元素之間的計算
DoubleVec y(1000), a(1000), b(1000), c(1000), d(1000); // 向量長度 1000
// 向量計算
y = (a + b) / (c - d);
// 等價於
DoubleVec __t1 = a + b;
DoubleVec __t2 = c - d;
DoubleVec __t3 = __t1 / __t2;
y = __t3;

模板程式碼實現向量計算如下:

template<class A> DVExpr;
class DVec{
    // ...
    template<class A>
    DVec& operator=(const DVExpr<A>&); // 由 = 引起向量逐個元素的表示式值計算並賦值
};
DVec y(1000), a(1000), b(1000), c(1000), d(1000); // 向量長度 1000
// 向量計算
y = (a + b) / (c - d);
// 等價於
for(int i=0; i<1000; ++i) {
    y[i] = (a[i] + b[i]) / (c[i] + d[i]);
}

不過值得一提的是,傳統程式碼可以用 C++11 的右值引用提升效能,C++11 新特性我們以後再詳細討論。

我們這裡看下文獻[4] Expression templates 實現的版本,它用到了編譯期多型,編譯期多型示意程式碼如下(關於這種程式碼形式有個名字叫 curiously recurring template pattern, CRTP,見文獻[4]):

// 模板基類,定義介面,具體實現由模板引數,即子類實現
template <typename D>
class base {
public:
    void f1() { static_cast<E&>(*this).f1(); } // 直接呼叫子類實現
    int f2() const { static_cast<const E&>(*this).f1(); }
};
// 子類
class dirived1 : public base<dirived1> {
public:
    void f1() { /* ... */ }
    int f2() const { /* ... */ }
};
template<typename T>
class dirived2 : public base<dirived2<T>> {
public:
    void f1() { /* ... */ }
    int f2() const { /* ... */ }
};

簡化後(向量長度固定為1000,元素型別為 double)的向量計算程式碼如下:

#include <iostream> // std::cout

// A CRTP base class for Vecs with a size and indexing:
template <typename E>
class VecExpr {
public:
    double operator[](int i) const { return static_cast<E const&>(*this)[i]; }
    operator E const&() const { return static_cast<const E&>(*this); } // 向下型別轉換
};
// The actual Vec class:
class Vec : public VecExpr<Vec> {
    double _data[1000];
public:
    double&  operator[](int i) { return _data[i]; }
    double operator[](int i) const { return _data[i]; }
    template <typename E>
    Vec const& operator=(VecExpr<E> const& vec) {
        E const& v = vec;
        for (int i = 0; i<1000; ++i) _data[i] = v[i];
        return *this;
    }
    // Constructors
    Vec() { }
    Vec(double v) { for(int i=0; i<1000; ++i) _data[i] = v; }
};

template <typename E1, typename E2>
class VecDifference : public VecExpr<VecDifference<E1, E2> > {
    E1 const& _u; E2 const& _v;
public:
    VecDifference(VecExpr<E1> const& u, VecExpr<E2> const& v) : _u(u), _v(v) { }
    double operator[](int i) const { return _u[i] - _v[i]; }
};
template <typename E>
class VecScaled : public VecExpr<VecScaled<E> > {
    double _alpha; E const& _v;
public:
    VecScaled(double alpha, VecExpr<E> const& v) : _alpha(alpha), _v(v) { }
    double operator[](int i) const { return _alpha * _v[i]; }
};

// Now we can overload operators:
template <typename E1, typename E2> VecDifference<E1, E2> const
operator-(VecExpr<E1> const& u, VecExpr<E2> const& v) {
    return VecDifference<E1, E2>(u, v);
}
template <typename E> VecScaled<E> const
operator*(double alpha, VecExpr<E> const& v) {
    return VecScaled<E>(alpha, v);
}

int main() {
    Vec u(3), v(1); double alpha=9; Vec y;
    y = alpha*(u - v);
    std::cout << y[999] << '\n';
    std::cin.get(); return 0;
}
18

“alpha*(u – v)” 的型別推斷過程如下圖所示,其中有子類到基類的隱式型別轉換:

Expression templates

這裡可以看到基類的作用:提供統一的介面,讓 operator- 和 operator* 可以寫成統一的模板形式。

 

7. 特性,策略,標籤

利用迭代器,我們可以實現很多通用演算法,迭代器在容器與演算法之間搭建了一座橋樑。求和函式模板如下:

#include <iostream> // std::cout
#include <vector>

template<typename iter>
typename iter::value_type mysum(iter begin, iter end) {
    typename iter::value_type sum(0);
    for(iter i=begin; i!=end; ++i) sum += *i;
    return sum;
}

int main() {
    std::vector<int> v;
    for(int i = 0; i<100; ++i) v.push_back(i);
    std::cout << mysum(v.begin(), v.end()) << '\n';
    std::cin.get(); return 0;
}
4950

我們想讓 mysum() 對指標引數也能工作,畢竟迭代器就是模擬指標,但指標沒有巢狀型別 value_type,可以定義 mysum() 對指標型別的特例,但更好的辦法是在函式引數和 value_type 之間多加一層 — 特性(traits)(參考了文獻[1]第72頁,特性詳見文獻[1] 12.1):

// 特性,traits
template<typename iter>
class mytraits{
public: typedef typename iter::value_type value_type;
};
template<typename T>
class mytraits<T*>{
public: typedef T value_type;
};

template<typename iter>
typename mytraits<iter>::value_type mysum(iter begin, iter end) {
    typename mytraits<iter>::value_type sum(0);
    for(iter i=begin; i!=end; ++i) sum += *i;
    return sum;
}

int main() {
    int v[4] = {1,2,3,4};
    std::cout << mysum(v, v+4) << '\n';
    std::cin.get(); return 0;
}
10

其實,C++ 標準定義了類似的 traits:std::iterator_trait(另一個經典例子是 std::numeric_limits) 。特性對型別的資訊(如 value_type、 reference)進行包裝,使得上層程式碼可以以統一的介面訪問這些資訊。C++ 模板超程式設計會涉及大量的型別計算,很多時候要提取型別的資訊(typedef、 常量值等),如果這些型別的資訊的訪問方式不一致(如上面的迭代器和指標),我們將不得不定義特例,這會導致大量重複程式碼的出現(另一種程式碼膨脹),而通過加一層特性可以很好的解決這一問題。另外,特性不僅可以對型別的資訊進行包裝,還可以提供更多資訊,當然,因為加了一層,也帶來複雜性。特性是一種提供元資訊的手段。

策略(policy)一般是一個類别範本,典型的策略是 STL 容器(如 std::vector<>,完整宣告是template<class T, class Alloc=allocator<T>> class vector;)的分配器(這個引數有預設引數,即預設儲存策略),策略類將模板的經常變化的那一部分子功能塊集中起來作為模板引數,這樣模板便可以更為通用,這和特性的思想是類似的(詳見文獻[1] 12.3)。

標籤(tag)一般是一個空類,其作用是作為一個獨一無二的型別名字用於標記一些東西,典型的例子是 STL 迭代器的五種型別的名字(input_iterator_tag, output_iterator_tag, forward_iterator_tag, bidirectional_iterator_tag, random_access_iterator_tag),std::vector<int>::iterator::iterator_category 就是 random_access_iterator_tag,可以用第1節判斷型別是否等價的模板檢測這一點:

#include <iostream>
#include <vector>

template<typename T1, typename T2> // 通例,返回 false
class theSameType       { public: enum { ret = false }; };
template<typename T>               // 特例,兩型別相同時返回 true
class theSameType<T, T> { public: enum { ret = true }; };

int main(){
    std::cout << theSameType< std::vector<int>::iterator::iterator_category,
                              std::random_access_iterator_tag >::ret << '\n';
    std::cin.get(); return 0;
}
1

有了這樣的判斷,還可以根據判斷結果做更復雜的超程式設計邏輯(如一個演算法以迭代器為引數,根據迭代器標籤進行特例化以對某種迭代器特殊處理)。標籤還可以用來分辨函式過載,第5節中就用到了這樣的標籤(recursion)(標籤詳見文獻[1] 12.1)。

 

8. 更多型別計算

在第1節我們講型別等價的時候,已經見到了一個可以判斷兩個型別是否等價的模板,這一節我們給出更多例子,下面是判斷一個型別是否可以隱式轉換到另一個型別的模板(參考了文獻[6] Static interface checking):

#include <iostream> // std::cout

// whether T could be converted to U
template<class T, class U>
class ConversionTo {
    typedef char Type1[1]; // 兩種 sizeof 不同的型別
    typedef char Type2[2];
    static Type1& Test( U ); // 較下面的函式,因為引數取值範圍小,優先匹配
    static Type2& Test(...); // 變長引數函式,可以匹配任何數量任何型別引數
    static T MakeT(); // 返回型別 T,用這個函式而不用 T() 因為 T 可能沒有預設建構函式
public:
    enum { ret = sizeof(Test(MakeT()))==sizeof(Type1) }; // 可以轉換時呼叫返回 Type1 的 Test()
};

int main() {
    std::cout << ConversionTo<int, double>::ret << '\n';
    std::cout << ConversionTo<float, int*>::ret << '\n';
    std::cout << ConversionTo<const int&, int&>::ret << '\n';
    std::cin.get(); return 0;
}
1
0
0

下面這個例子檢查某個型別是否含有某個巢狀型別定義(參考了文獻[4] Substitution failure is not an erro (SFINAE)),這個例子是個內省(反射的一種):

#include <iostream>
#include <vector>

// thanks to Substitution failure is not an erro (SFINAE)
template<typename T>
struct has_typedef_value_type {
    typedef char Type1[1];
    typedef char Type2[2];
    template<typename C> static Type1& test(typename C::value_type*);
    template<typename> static Type2& test(...);
public:
    static const bool ret = sizeof(test<T>(0)) == sizeof(Type1); // 0 == NULL
};

struct foo { typedef float lalala; };

int main() {
    std::cout << has_typedef_value_type<std::vector<int>>::ret << '\n';
    std::cout << has_typedef_value_type<foo>::ret << '\n';
    std::cin.get(); return 0;
}
1
0

這個例子是有缺陷的,因為不存在引用的指標,所以不用用來檢測引用型別定義。可以看到,因為只涉及型別推斷,都是編譯期的計算,不涉及任何可執行程式碼,所以類的成員函式根本不需要具體實現。

9. 元容器

文獻[1]第 13 章講了元容器,所謂元容器,就是類似於 std::vector<> 那樣的容器,不過它儲存的是後設資料 — 型別,有了元容器,我們就可以判斷某個型別是否屬於某個元容器之類的操作。

在講元容器之前,我們先來看看偽變長引數模板(文獻[1] 12.4),一個可以儲存小於某個數(例子中為 4 個)的任意個數,任意型別資料的元組(tuple)的例子如下(參考了文獻[1] 第 225~227 頁):

#include <iostream>

class null_type {}; // 標籤類,標記引數列表末尾
template<typename T0, typename T1, typename T2, typename T3>
class type_shift_node {
public:
    typedef T0 data_type;
    typedef type_shift_node<T1, T2, T3, null_type> next_type; // 引數移位了
    static const int num = next_type::num + 1; // 非 null_type 模板引數個數
    data_type data; // 本節點資料
    next_type next; // 後續所有節點資料
    type_shift_node() :data(), next() { } // 建構函式
    type_shift_node(T0 const& d0, T1 const& d1, T2 const& d2, T3 const& d3)
        :data(d0), next(d1, d2, d3, null_type()) { } // next 引數也移位了
};
template<typename T0> // 特例,遞迴終止
class type_shift_node<T0, null_type, null_type, null_type> {
public:
    typedef T0 data_type;
    static const int num = 1;
    data_type data; // 本節點資料
    type_shift_node() :data(), next() { } // 建構函式
    type_shift_node(T0 const& d0, null_type, null_type, null_type) : data(d0) { }
};
// 元組類别範本,預設引數 + 巢狀遞迴
template<typename T0, typename T1=null_type, typename T2=null_type,
         typename T3=null_type>
class my_tuple {
public:
    typedef type_shift_node<T0, T1, T2, T3> tuple_type;
    static const int num = tuple_type::num;
    tuple_type t;
    my_tuple(T0 const& d0=T0(),T1 const& d1=T1(),T2 const& d2=T2(),T3 const& d3=T3())
        : t(d0, d1, d2, d3) { } // 建構函式,預設引數
};

// 為方便訪問元組資料,定義 get<unsigned>(tuple) 函式模板
template<unsigned i, typename T0, typename T1, typename T2, typename T3>
class type_shift_node_traits {
public:
    typedef typename
        type_shift_node_traits<i-1,T0,T1,T2,T3>::node_type::next_type node_type;
    typedef typename node_type::data_type data_type;
    static node_type& get_node(type_shift_node<T0,T1,T2,T3>& node)
    { return type_shift_node_traits<i-1,T0,T1,T2,T3>::get_node(node).next; }
};
template<typename T0, typename T1, typename T2, typename T3>
class type_shift_node_traits<0, T0, T1, T2, T3> {
public:
    typedef typename type_shift_node<T0,T1,T2,T3> node_type;
    typedef typename node_type::data_type data_type;
    static node_type& get_node(type_shift_node<T0,T1,T2,T3>& node)
    { return node; }
};
template<unsigned i, typename T0, typename T1, typename T2, typename T3>
typename type_shift_node_traits<i,T0,T1,T2,T3>::data_type
get(my_tuple<T0,T1,T2,T3>& tup) {
    return type_shift_node_traits<i,T0,T1,T2,T3>::get_node(tup.t).data;
}

int main(){
    typedef my_tuple<int, char, float> tuple3;
    tuple3 t3(10, 'm', 1.2f);
    std::cout << t3.t.data << ' '
              << t3.t.next.data << ' '
              << t3.t.next.next.data << '\n';
    std::cout << tuple3::num << '\n';
    std::cout << get<2>(t3) << '\n'; // 從 0 開始,不要出現 3,否則將出現不可理解的編譯錯誤
    std::cin.get(); return 0;
}
10 m 1.2
3
1.2

C++11 引入了變長模板引數,其背後的原理也是模板遞迴(文獻[1]第 230 頁)。

利用和上面例子類似的模板引數移位遞迴的原理,我們可以構造一個儲存“型別”的元組,即元容器,其程式碼如下(和文獻[1]第 237 頁的例子不同):

#include <iostream>

// 元容器
template<typename T0=void, typename T1=void, typename T2=void, typename T3=void>
class meta_container {
public:
    typedef T0 type;
    typedef meta_container<T1, T2, T3, void> next_node; // 引數移位了
    static const int size = next_node::size + 1; // 非 null_type 模板引數個數
};
template<> // 特例,遞迴終止
class meta_container<void, void, void, void> {
public:
    typedef void type;
    static const int size = 0;
};

// 訪問元容器中的資料
template<typename C, unsigned i>
class get {
public:
    static_assert(i<C::size, "get<C,i>: index exceed num"); // C++11 引入靜態斷言
    typedef typename get<C,i-1>::c_type::next_node c_type;
    typedef typename c_type::type ret_type;
};
template<typename C>
class get<C, 0> {
public:
    static_assert(0<C::size, "get<C,i>: index exceed num"); // C++11 引入靜態斷言
    typedef C c_type;
    typedef typename c_type::type ret_type;
};

// 在元容器中查詢某個型別,找到返回索引,找不到返回 -1
template<typename T1, typename T2> class same_type { public: enum { ret = false }; };
template<typename T> class same_type<T, T> { public: enum { ret = true }; };

template<bool c, typename Then, typename Else> class IF_ { };
template<typename Then, typename Else>
class IF_<true, Then, Else> { public: typedef Then reType; };
template<typename Then, typename Else>
class IF_<false, Then, Else> { public: typedef Else reType; };

template<typename C, typename T>
class find {
    template<int i> class number { public: static const int ret = i; };
    template<typename C, typename T, int i>
    class find_i {
    public:
        static const int ret = IF_< same_type<get<C,i>::ret_type, T>::ret,
            number<i>, find_i<C,T,i-1> >::reType::ret;
    };
    template<typename C, typename T>
    class find_i<C, T, -1> {
    public:
        static const int ret = -1;
    };
public:
    static const int ret = find_i<C, T, C::size-1>::ret;
};

int main(){
    typedef meta_container<int, int&, const int> mc;
    int a = 9999;
    get<mc, 1>::ret_type aref = a;
    std::cout << mc::size << '\n';
    std::cout << aref << '\n';
    std::cout << find<mc, const int>::ret << '\n';
    std::cout << find<mc, float>::ret << '\n';
    std::cin.get(); return 0;
}
3
9999
2
-1

上面例子已經實現了儲存型別的元容器,和元容器上的查詢演算法,但還有一個小問題,就是它不能處理模板,編譯器對模板的操縱能力遠不如對型別的操縱能力強(提示:類别範本例項是型別),我們可以一種間接方式實現儲存“模板元素”,即用模板的一個代表例項(如全用 int 為引數的例項)來代表這個模板,這樣對任意模板例項,只需判斷其模板的代表例項是否在容器中即可,這需要進行型別過濾:對任意模板的例項將其替換為指定模板引數的代表例項,型別過濾例項程式碼如下(參考了文獻[1]第 241 頁):

// 型別過濾,meta_filter 使用時只用一個引數,設定四個模板引數是因為,模板通例的引數列表
// 必須能夠包含特例引數列表,後面三個引數設定預設值為 void 或標籤模板
template<typename T> class dummy_template_1 {};
template<typename T0, typename T1> class dummy_template_2 {};
template<typename T0, typename T1 = void,
    template<typename> class tmp_1 = dummy_template_1,
    template<typename, typename> class tmp_2 = dummy_template_2>
class meta_filter { // 通例,不改變型別
public:
    typedef T0 ret_type;
};
                    // 匹配任何帶有一個型別引數模板的例項,將模板例項替換為代表例項
template<template<typename> class tmp_1, typename T>
class meta_filter<tmp_1<T>, void, dummy_template_1, dummy_template_2> {
public:
    typedef tmp_1<int> ret_type;
};
                    // 匹配任何帶有兩個型別引數模板的例項,將模板例項替換為代表例項
template<template<typename, typename> class tmp_2, typename T0, typename T1>
class meta_filter<tmp_2<T0, T1>, void, dummy_template_1, dummy_template_2> {
public:
    typedef tmp_2<int, int> ret_type;
};

現在,只需將上面元容器和元容器查詢函式修改為:對模板例項將其換為代表例項,即修改 meta_container<> 通例中“typedef T0 type;”語句為“typedef typename meta_filter<T0>::ret_type type;”,修改 find<> 的最後一行中“T”為“typename meta_filter<T>::ret_type”。修改後,下面程式碼的執行結果是:

template<typename, typename> class my_tmp_2;

// 自動將 my_tmp_2<float, int> 過濾為 my_tmp_2<int, int>
typedef meta_container<int, float, my_tmp_2<float, int>> mc2;
// 自動將 my_tmp_2<char, double> 過濾為 my_tmp_2<int, int>
std::cout << find<mc2, my_tmp_2<char, double>>::ret << '\n'; // 輸出 2
2

10. 總結

博文比較長,總結一下所涉及的東西:

  • C++ 模板包括函式模板和類别範本,模板引數形式有:型別、模板型、非型別(整型、指標);
  • 模板的特例化分完全特例化和部分特例化,例項將匹配引數集合最小的特例;
  • 用例項引數替換模板形式引數稱為例項化,例項化的結果是產生具體型別(類别範本)或函式(函式模板),同一模板實參完全等價將產生等價的例項型別或函式;
  • 模板一般在標頭檔案中定義,可能被包含多次,編譯和連結時會消除等價模板例項;
  • template、typename、this 關鍵字用來消除歧義,避免編譯錯誤或產生不符預期的結果;
  • C++11 對模板引入了新特性:“>>”、函式模板也可以有預設引數、變長模板引數、外部模板例項(extern),並棄用 export template;
  • C++ 模板是圖靈完備的,模板程式設計是函式程式設計風格,特點是:沒有可變的儲存、遞迴,以“<>”為輸入,typedef 或靜態常量為輸出;
  • 編譯期數值計算雖然實際意義不大,但可以很好證明 C++ 模板的能力,可以用模板實現類似普通程式中的 if 和 while 語句;
  • 一個實際應用是迴圈展開,雖然編譯器可以自動迴圈展開,但我們可以讓這一切更可控;
  • C++ 模板程式設計的兩個問題是:難除錯,會產生冗長且難以閱讀的編譯錯誤資訊、程式碼膨脹(原始碼膨脹、二進位制物件檔案膨脹),改進的方法是:增加一些檢查程式碼,讓編譯器及時報錯,使用特性、策略等讓模板更通用,可能的話合併一些模板例項(如將程式碼提出去做成單獨模板);
  • 表示式模板和向量計算是另一個可加速程式的例子,它們將計算表示式編碼到型別,這是通過模板巢狀引數實現的;
  • 特性,策略,標籤是模板程式設計常用技巧,它們可以是模板變得更加通用;
  • 模板甚至可以獲得型別的內部資訊(是否有某個 typedef),這是反射中的內省,C++ 在語言層面對反射支援很少(typeid),這不利於模板超程式設計;
  • 可以用遞迴實現偽變長引數模板,C++11 變長引數模板背後的原理也是模板遞迴;
  • 元容器儲存元資訊(如型別)、型別過濾過濾某些型別,它們是超程式設計的高階特性。

 

進一步學習

C++ 確實比較複雜,這可能是因為,雖然 C++ 語言層次比較低,但它卻同時可以實現很多高階特性。進一步學習 C++ 模板超程式設計的途徑很多:

  • C++ 標準庫的 STL 可能是最好的學習案例,尤其是其容器、迭代器、通用演算法、函式類别範本等部件,實現機制很巧妙;
  • 另外一個 C++ 庫也值得一看,那就是 Boost 庫,Boost 的超程式設計庫參考文獻[16];
  • 很推薦《深入實踐C++模板程式設計》這本書,這篇博文大量參考了這本書;
  • wikibooks.org 上有個介紹 C++ 各種程式設計技巧書:More C++ Idioms,文獻[15];
  • 文獻[17]列了 C++ 模板的參考書,共四本;
  • 好多東西,書上講的比較淺顯,而且不全面,有時候直接看 C++ 標準(最新 C++11)可能更為高效,C++ 標準並不是想象中那樣難讀,C++ 標準委員會網站的 Papers 也很值得看,文獻[3]。

 

參考文獻

  1. 深入實踐C++模板程式設計,溫宇傑著,2013(到噹噹網);
  2. C++程式設計語言,Bjarne Stroustrup著,裘宗燕譯,2002(到噹噹網);
  3. C++標準,ISO/IEC 14882:2003,ISO/IEC 14882:2011(到ISO網站C++標準委員會);
  4. wikipedia.org(C++模板Template metaprogrammingCuriously recurring template patternSubstitution failure is not an erro (SFINAE)Expression templatesC++11C++14);
  5. What does a call to ‘this->template [somename]‘ do? (stackoverflow問答);
  6. Advanced C++ Lessons,chapter 6,線上教程,2005(到網站);
  7. C++ TUTORIAL – TEMPLATES – 2015,bogotobogo.com 網上教程(到網站);
  8. C++ Templates are Turing Complete,Todd L. Veldhuizen,2003(作者網站已經停了,archive.org 儲存的版本,archive.org 可能被限制瀏覽);
  9. Metaprogramming in C++,Johannes Koskinen,2004(中科大老師儲存的版本);
  10. C++ Template Metaprogramming in 15ish Minutes(Stanford 課程 PPT,到網站);
  11. Template Metaprograms,Todd Veldhuizen,1995(archive.org 儲存 Todd Veldhuizen 主頁,可能限制訪問,線上 PS 檔案轉 PDF 檔案網站);
  12. Expression Templates,Todd Veldhuizen,1995;
  13. C++ Templates as Partial Evaluation,Todd Veldhuizen,1999;
  14. Erwin Unruh 寫的第一個模板超程式設計程式
  15. wikibooks.org(C++ Programming/Templates/Template Meta-ProgrammingMore C++ Idioms);
  16. THE BOOST MPL LIBRARY online docs(到網站);
  17. Best introduction to C++ template metaprogramming?(stackoverflow問答)。

注:參考文獻中所給的連結,開啟不了的,可以參見我的另一篇部落格配置瀏覽器

Johannes Koskinen 論文,Stanford 課程 PPT,Todd Veldhuizen 論文我網盤儲存的副本 -

連結: http://pan.baidu.com/s/1ntJstvF 密碼: hogb

相關文章