右值引用的功能
首先,我並不介紹什麼是右值引用,而是以一個例子裡來介紹一下右值引用的功能:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 |
#include <iostream> #include <vector> using namespace std; class obj { public : obj() { cout << ">> create obj " << endl; } obj(const obj& other) { cout << ">> copy create obj " << endl; } }; vector<obj> foo() { vector<obj> c; c.push_back(obj()); cout << "---- exit foo ----" << endl; return c; } int main() { vector<obj> k; k = foo(); } |
首先我們編譯一下這個函式,執行結果如下:
1 2 3 4 5 6 7 |
tianfang > g++ main.cpp tianfang > a.out >> create obj >> copy create obj ---- exit foo ---- >> copy create obj tianfang > |
可以看到,對obj物件執行了兩次構造。vector是一個常用的容器了,我們可以很容易的分析這這兩次拷貝構造的時機:
-
foo函式第二行,呼叫push_back的時候,會在vector裡建立一個obj的副本
-
main函式第二行,執行復制函式的時候,會把foo()返回的物件全部複製過來,再次執行一次拷貝構造
由於物件的拷貝構造的開銷是非常大的,因此我們想就可能避免他們。其中,第一次拷貝構造是vector的特性所決定的,不可避免。但第二次拷貝構造,在C++ 11中就是可以避免的了。
1 2 3 4 5 6 |
tianfang > g++ -std=c++11 main.cpp tianfang > a.out >> create obj >> copy create obj ---- exit foo ---- tianfang > |
可以看到,我們除了加上了一個-std=c++11選項外,什麼都沒幹,但現在就把第二次的拷貝構造給去掉了。它是如何實現這一過程的呢?
在老版本中,當我們執行第二行的賦值操作的時候,執行過程如下:
-
foo()函式返回一個臨時物件(這裡用~tmp來標識它)
-
執行vector的 ‘=’ 函式,將物件k中的現有成員刪除,將~tmp的成員複製到k中來
-
刪除臨時物件~tmp
在C++11的版本中,執行過程如下:
-
foo()函式返回一個臨時物件(這裡用~tmp來標識它)
-
執行vector的 ‘=’ 函式,將物件k中的成員~tmp的成員互換,此時k中的成員就被替換成了~tmp中的成員。
-
刪除臨時物件~tmp(此時就刪除了以前的k中的成員)
關鍵的過程就是第2步,它不是複製而是交換,從而避免的成員的拷貝,但效果卻是一樣的。不用修改程式碼,效能卻得到了提升,對於程式設計師來說就是一份免費的午餐。
但是,這份免費的午餐也不是無條件就可以獲取的,帶上-std=c++11編譯時,如果使用STL程式碼可以享用這份午餐,但如果使用我們以前的老程式碼發現還是和以前的功能是一樣的,那麼,如何讓我們以前的程式碼也能得到這個效率的提升呢?
通過交換減少資料的拷貝
為了演示如何在我們的程式碼中也獲取這個效能提升,首先我先寫了一個山寨的vector:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 |
#include <iostream> #include <vector> using namespace std; class obj { public : obj() { cout << ">> create obj " << endl; } obj(const obj& other) { cout << ">> copy create obj " << endl; } }; template <class T> class container { public: T* value; public: container() : value(NULL) {}; ~container() { delete value; } container(const container& other) { value = new T(*other.value); } const container& operator = (const container& other) { delete value; value = new T(*other.value); return *this; } void push_back(const T& item) { delete value; value = new T(item); } }; container<obj> foo() { container<obj> c; c.push_back(obj()); cout << "---- exit foo ----" << endl; return c; } int main() { container<obj> k ; k = foo(); } |
這個vector只能容納一個元素,但並不妨礙我們的演示,其功能和前面的例子是一樣的,執行這段程式碼,結果如下:
1 2 3 4 5 6 7 8 |
tianfang > make g++ -std=c++11 main.cpp tianfang > a.out >> create obj >> copy create obj ---- exit foo ---- >> copy create obj tianfang > |
如前所述,仍然有兩次拷貝構造。其實前面已經說過交換實現減少拷貝構造的原理,那麼,我們可以通過修改 ‘=’ 函式來手動實現這一過程。
1 2 3 4 5 6 7 |
const container& operator = (container& other) { T* tmp = value; value = other.value; other.value = tmp; return *this; } |
在VC中執行這段程式碼,發現執行結果和預期一致,
1 2 3 |
>> create obj >> copy create obj ---- exit foo ---- |
但是,gcc中卻無法通過編譯,原因很簡單:gcc期望的賦值函式的引數是const型的,而這裡為了交換成員,而不能使用const型。
那麼,雖然gcc中不能生效,是否可以說在vc中就可以以這種形式獲取效能提升呢?答案是否定的。雖然在這段程式碼中這麼寫沒有問題,但賦值函式本身是期望複製功能的,而不是交換。例如,修改後下面的執行結果就不對了。
1 2 3 4 5 6 7 8 |
int main() { container<obj> k, k2; k = foo(); //預期結果是複製,但執行了交換 k2 = k; } |
gcc的告警是有道理的:如果 ‘=’ 函式實現的是複製功能,雖然效率低點,但保證了功能正確,但如果實現的是交換的功能,則不能保證功能一定正確。只有當 ‘=’ 函式右邊的物件為一個臨時變數的時候,由於臨時變數會馬上被刪除掉,此時的交換和複製的效果是一樣的。其實VC也應該把這個告警加上才合適。
PS:對臨時變數定義和來源不清楚的朋友可以參考一下這篇文章。
現在的問題是:我們無法在賦值函式裡區分傳入的是一個臨時物件還是非臨時物件,因此只能執行復制操作。為了解決這一問題,c++中引入了一個新的賦值函式的過載形式:
1 |
container& operator = (container&& other) |
這個賦值函式通常稱為移動賦值函式,和老版本的相比,它有兩點區別:
-
入參不是const型,因此它是可以更改入參的值的,從而實現交換操作
-
入參前面有兩個&號,這個是C++11引入的新語法,稱為右值引用,它的使用方式和普通引用是一樣的,唯一的區別是可以指向臨時變數。
現在,我們就有兩個版本的賦值函式了,C++11在語法級別也做了適應:
-
如果入參是臨時變數,則執行移動賦值函式,如果沒有定義移動賦值函式,則執行復制賦值函式(以保證老版本程式碼能編譯通過)
-
如果入參不是臨時變數,則執行普通的複製賦值函式
現在,我們實現一下山寨版的移動賦值函式:
1 2 3 4 5 6 7 8 |
container& operator = (container&& other) { delete value; value = other.value; other.value = NULL; return *this; } |
和移動賦值函式相應的,也有一個一個移動建構函式,也最好實現以下:
1 2 3 4 5 |
container (container&& other) { value = other.value; other.value = NULL; } |
我們也可以實現自己的右值引用版的過載函式,這裡就不多介紹了。
注意:本文所示的程式碼只是為了演示和實現右值引用,力求簡潔,並沒有寫得很完善(一個典型的缺失就是在賦值函式中沒有判斷入參是否是本身),請不要將其應用於專案中。
完善的版本請看MSDN文章:如何編寫一個移動建構函式,其相應的對右值引用的介紹文章Rvalue引用宣告:&&也非常值得一讀。
通過std::move函式顯式使用交換
首先看一下這段程式碼:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
class bigobj { public : bigobj() { cout << ">> create obj " << endl; } bigobj(const bigobj& other) { cout << ">> copy create obj " << endl; } bigobj(bigobj&& other) { cout << ">> move create obj " << endl; } }; int main() { list<bigobj> list; for(int i = 0; i < 3; i++) { bigobj obj; list.push_back(obj); } } |
執行的時候就會發現:雖然我們定義了移動建構函式,但是它仍然會執行拷貝建構函式。這是因為編譯器並不認為obj是臨時變數。關於什麼變數才是臨時變數,前文已經給了個連結來說明它,簡單的說,我們能夠看到的命名變數都不是臨時變數。
雖然obj物件不是語言級別的臨時變數,但是從功能上來看,它就是一個臨時變數,是可以使用移動建構函式來消除拷貝帶來的效能損失的。為了解決這一問題,C++提供了一個move函式來把obj變數強制轉換為右值引用,這樣就可以使用移動建構函式了。
1 2 3 4 5 |
for(int i = 0; i < 3; i++) { bigobj obj; list.push_back(std::move(obj)); } |
不過,需要注意的是,和系統識別的臨時變數而自動使用右值引用不同,這種強制轉換是有一定的風險的,由於在push_back後執行了交換操作,如果再次使用它會出現非預期的結果,只有能確定該變數不會再次被使用才能執行這種轉換。