透徹理解C++11新特性:右值引用、std::move、std::forward

KillerAery發表於2020-04-30

C++11出現的右值相關語法可謂是很多C++程式設計師難以理解的新特性,不少人知其然而不知其所以然,面試被問到時大概就只知道可以減少開銷,但是為什麼減少開銷、減少了多少開銷、什麼時候用...這些問題也不一定知道,於是我寫下了這篇夾帶自己理解的博文,希望它對你有所幫助。

淺拷貝、深拷貝


在介紹右值引用等概念之前,可以先來認識下淺拷貝(shallow copy)和深拷貝(deep copy)。

這裡舉個例子:

class Vector{
    int num;
    int* a;
public:
    void ShallowCopy(Vector& v);
    void DeepCopy(Vector& v);
};
  • 淺拷貝:按位拷貝物件,建立的新物件有著原始物件屬性值的一份精確拷貝(但不包括指標指向的記憶體)。
//淺拷貝
void Vector::ShallowCopy(Vector& v){
    this.num = v.num;
    this.a = v.a;
}
  • 深拷貝:拷貝所有的屬性(包括屬性指向的動態分配的記憶體)。換句話說,當物件和它所引用的物件一起拷貝時即發生深拷貝。
//深拷貝
void Vector::DeepCopy(Vector& v){
    this.num = v.num;
    this.a = new int[num];
    for(int i=0;i<num;++i){a[i]=v.a[i]}
}

可以看到,深拷貝的開銷往往比淺拷貝大(除非沒有指向動態分配記憶體的屬性),所以我們就傾向儘可能使用淺拷貝。

但是淺拷貝的有一個問題:當有指向動態分配記憶體的屬性時,會造成多個物件共用這塊動態分配記憶體,從而可能導致衝突。一個可行的辦法是:每次做淺拷貝後,必須保證原始物件不再訪問這塊記憶體(即轉移所有權),這樣就保證這塊記憶體永遠只被一個物件使用。

那有什麼物件在被拷貝後可以保證不再訪問這塊記憶體呢?相信大家心裡都有答案:臨時物件。

左值、右值


為了讓編譯器識別出臨時物件,從而好做淺拷貝優化,於是C++引入了左值(lvalue)、右值(rvalue)的概念。

  • 左值:表示式結束後依然存在的持久物件。
  • 右值:表示式結束後就不再存在的臨時物件。

之所以取名左值右值,是因為在等式左邊的值往往是持久存在的左值型別,在等式右邊的表示式值往往是臨時物件。

a = ++b;
a = b+c*2;
a = func();

更直觀的理解是:有變數名、可以取地址的物件都是左值,沒有變數名、不可以取地址的都是右值。(因為有無變數名意味著這個物件是否在下一行程式碼時依然存在)

右值引用型別


有了左值、右值的概念,我們就很清楚認識到右值都是些短暫存在的臨時物件。

於是,C++11 為了匹配這些左右值型別,引入了右值引用型別 &&
右值引用型別負責匹配右值,左值引用則負責匹配左值。

因此剛剛的淺拷貝、深拷貝例子,我們可以無需顯式呼叫淺拷貝或深拷貝函式,而是呼叫過載函式:

//左值引用形參=>匹配左值
void Vector::Copy(Vector& v){
    this.num = v.num;
    this.a = new int[num];
    for(int i=0;i<num;++i){a[i]=v.a[i]}
}

//右值引用形參=>匹配右值
void Vector::Copy(Vector&& temp){
    this.num = temp.num;
    this.a = temp.a;
}

當然,最標準還是編寫成各種建構函式(拷貝構造、移動構造、賦值構造、移動賦值構造):

移動的意思是轉移所有權。由於右值 大部分 都是臨時的值,臨時值釋放後也就不再持有屬性的所有權,因此這相當於轉移所有權的行為。

//拷貝建構函式:這意味著深拷貝
Vector::Vector(Vector& v){
    this.num = v.num;
    this.a = new int[num];
    for(int i=0;i<num;++i){a[i]=v.a[i]}
}
//移動建構函式:這意味著淺拷貝
Vector::Vector(Vector&& temp){
    this.num = temp.num;
    this.a = temp.a;
    temp.a = nullptr;    //實際上Vector一般都會在解構函式來釋放指向的記憶體,所以需賦值空地址避免釋放
}

雖然從優雅的實現深、淺拷貝這個目的開始出發,C++11的移動語義可以不止用於淺拷貝,得益於轉移所有權的特性,我們還可以做其它事情,例如在右值所佔有的空間臨時存放一些東西。

強轉右值 std::move


除了上面說的臨時值,有些左值其實也很適合轉移所有權:

void func(){
    Vector result;
    //...DoSomehing with ans
    if(xxx){ans = result;}  //現在我希望把結果提取到外部的變數a上。
    return;
}

可以看到result賦值給ans後就不再被使用,我們期望它呼叫的是移動賦值建構函式。
但是result是一個有變數名的左值型別,因此ans = result 呼叫的是賦值建構函式而非移動賦值建構函式。

為了將某些左值當成右值使用,C++11 提供了 std::move 函式以用於將某些左值轉成右值,以匹配右值引用型別。

這也是移動語義的由來:無論是臨時值還是被強轉的左值,只要遵守轉移所有權的保證,都可以使用移動語義。

void func(){
    Vector result;
    //...DoSomehing with ans
    if(xxx){ans = std::move(result);}   //呼叫的是移動賦值建構函式
    return;
}

重新審視右值引用


右值引用型別和右值的關係

有了上面的知識後,我們來重新審視一下右值引用型別。

先看看如下程式碼:

void test(Vector& o) {std::cout << "為左值。" << std::endl;}
void test(Vector&& temp) {std::cout << "為右值。" << std::endl;}

int main(){
    Vector a;
	Vector&& b = Vector();
        //請分別回答:a、std::move(a)、b 分別是左值還是右值?
	test(a);
	test(std::move(a));
	test(b);
}

答:a是左值,std::move(a)是右值,但b卻是左值。

在這裡b雖然是 Vector&& 型別,但卻因為有變數名(即可持久存在),被編譯器認為是左值。

//即使函式返還值是臨時值,但返還型別是左值引用型別,因此被認為是持久存在的左值。
Vector& func1();
//函式返還值為右值引用型別=>是短暫存在的右值。
Vector&& func2();
//函式返還值為正常型別=>是短暫存在的右值。
Vector func3();

結論:右值引用型別只是用於匹配右值,而並非表示一個右值。因此,儘量不要宣告右值引用型別的變數,而只在函式形參使用它以匹配右值。

實際上C++ std::move的實現原理就是的強轉右值引用型別並返還之,由於函式返還值型別是臨時值,且返還的還是右值引用型別(非左值引用型別),因此該返還值會被判斷為右值。

函式引數傳遞

void func1(Vector v) {return;}
void func2(Vector && v) {return;}

int main() {
	Vector a;
	Vector &b = a;
	Vector c;
	Vector d;

    //請回答:不開優化的版本下,呼叫以下函式分別有多少Copy Consturct、Move Construct的開銷?
	func1(a);
	func1(b);
	func1(std::move(c));
	func2(std::move(d));
}

實際上在不開優化的版本下,如果實參為右值,呼叫func1的開銷只比func2多了一次移動建構函式和解構函式。

實參傳遞給形參,即形參會根據實參來構造。其結果是呼叫了移動建構函式;函式結束時則釋放形參。

倘若說物件的移動建構函式開銷較低(例如內部僅一個指標屬性),那麼使用無引用型別的形參函式是更優雅的選擇,而且還能接受左值引用型別或無引用的實參(儘管這兩種實參都會導致一次Copy Consturct)。

那我們在寫一般函式形參的時候,有必要每個函式都提供關於&&形參的過載版本嗎?

回答:一般來說是沒必要的。物件的移動構造(賦值)函式開銷不大時,我們可以只提供非引用型別和左值引用型別(避免Copy Construct)的過載版本,而不必編寫右值引用型別的過載版本。

函式返還值傳遞

Vector func1() {
    Vector a;
	return a;
}

Vector func2() {
	Vector a;
	return std::move(a);
}

Vector&& func3() {
	Vector a;
	return std::move(a);
}

int main() {
    //請回答:不開優化的版本下,執行以下3行程式碼分別有多少Copy Consturct、Move Construct的開銷?
	Vector test1 = func1();
	Vector test2 = func2();
	Vector test3 = func3();
}

同樣的道理,執行這3行程式碼實際上都沒有任何Copy Construct的開銷(這其中也有NRV技術的功勞),都是隻有一次Move Construct的開銷。

此外一提,func3是危險的。因為區域性變數釋放後,函式返還值仍持有它的右值引用。

因此,這裡也不建議函式返還右值引用型別,同前面傳遞引數類似的,移動構造開銷不大的時候,直接返還非引用型別就足夠了(在某些特殊場合有特別作用,例如std::move的實現)。

結論:我們應該把編寫右值引用型別相關的任務放在物件的構造、賦值函式上,而非一般函式。從源頭上出發,你就會發現在編寫其它程式碼時就會自然而然享受到了移動構造、移動賦值的優化效果。

萬能引用


接下來的內容都是屬於模板的部分了:萬能引用、引用摺疊、完美轉發。這部分更加難以理解,不編寫模板程式碼的話可以繞道了。

萬能引用(Universal Reference):

  • 發生型別推導(例如模板、auto)的時候,使用T&&型別表示為萬能引用,否則表示右值引用。
  • 萬能引用型別的形參既能匹配任意引用型別的左值、右值。

也就是說編寫模板函式時,只提供萬能引用形參一個版本就可以匹配左值、右值,不必編寫多個過載版本。

template<class T>
void func(T&& t){
    return;
}

int main() {
    Vector a,b;
	func(a);                //OK
	func(std::move(b));     //OK
}

此外需要注意的是,使用萬能引用引數的函式是最貪婪的函式,容易讓需要隱式轉換的實參匹配到不希望的轉發引用函式。例如下面程式碼:

template<class T>
  void f(T&& value);

void f(int a);
//當呼叫f(long型別的引數)或者f(short型別的引數),則不會匹配int版本而是匹配到萬能引用的版本

引用摺疊


使用萬能引用遇到的第一個問題是推導型別會出現不正確的引用型別:例如當模板引數T為Vector&或Vector&&,模板函式形參為T&&時,展開後變成Vector& &&或者Vector&& &&。

template<class T>
void func(T&& t){
    return;
}

int main(){
    func(Vector()); //模板引數T被推導為Vector&&
}

但顯然C++中是不允許對引用再進行引用的,於是為了讓模板引數正確傳遞引用性質,C++定義了一套用於推導型別的引用摺疊(Reference Collapse)規則:
所有的摺疊引用最終都代表一個引用,要麼是左值引用,要麼是右值引用。

引用摺疊 & &&
& & &
&& & &&

Example1:

func(Vector());

模板函式func的T被推導為Vector&&,形參object為T&&即展開後為Vector&& &&。由於摺疊規則的存在,形參object最終被摺疊推導為Vector&&型別。

Example2:

func(a);

模板函式func的T在這裡被推導為Vector&,形參object為T&&即展開後為Vector& &&。由於摺疊規則的存在,形參object最終被推導為Vector&型別。

完美轉發 std::forward<T>


當我們使用了萬能引用時,即使可以同時匹配左值、右值,但需要轉發引數給其他函式時,會丟失引用性質(形參是個左值,從而無法判斷到底匹配的是個左值還是右值)。

//當然我們也可以寫成如下過載程式碼,但是這已經違背了使用萬能引用的初衷(僅編寫一個模板函式就可以匹配左值、右值)
template<class T>
void func(T& t){
    doSomething(t);
}

template<class T>
void func(T&& t){
    doSomething(std::move(t));
}

完美轉發(Perfect Forwarding):C++11提供了完美轉發函式 std:forward<T> 。它可以在模板函式內給另一個函式傳遞引數時,將引數型別保持原本狀態傳入(如果形參推匯出是右值引用則作為右值傳入,如果是左值引用則作為左值傳入)。

於是現在我們可以這樣做了:

template<class T>
void func(T&& object){
    doSomething(std::forward<T>(object));
}

不借助std::forward<T>間接傳入引數的話,無論object是左值引用型別,還是右值引用型別,都會被視為左值。

std::forward<T>()的實現主要就一句return static_cast<T&&>(形參),實際上也是利用了摺疊規則。從而接受右值引用型別時,將右值引用型別的值返還(返還值為右值)。接受左值引用型別時,將左值引用型別的值返還(返還值為左值)。

而std::move<T>()的實現還需要先移除形參的所有引用性質得到無引用性質的型別(假設為T2),然後再return static_cast<T2&&>(形參),從而保證不會發生引用摺疊,而是直接作為右值引用型別的值返還(返還值為右值)。

相關文章