聊聊 C++ 右值引用 和 移動構造函數

一: 背景

最近在看 C++ 的右值引用和移動構造函數,感覺這東西一時半會還挺難理解的,可能是沒踩過這方面的坑,所以沒有那麼大的深有體會,不管怎麼說,這一篇我試著聊一下。

二: 右值引用

1. 它到底解決了什麼問題?

在其他程式語言中,很少聽到 右值引用 這個詞,我個人感覺還是 C++ 這個 值類型 優先的語言基因決定的,我們都知道 值類型 作為方法參數或者返回值時會生成自身的副本,如果 值類型 很大,那一來一回生成若干個深複製的 臨時對象 將會產生巨大的性能開銷。

總結一句話:右值引用 就是儘可能的減少這中間 臨時對象 個數,尤其是關聯到 heap 上的對象,僅此而已。

2. 右值引用是個什麼樣子?

說到 右值引用 得先說什麼是 右值,左值左值 一般都是帶有記憶體地址的變數,而 右值 一般是立即數或者運算過程中的臨時對象,這種對象不會有地址值,是不是很繞,我舉個例子吧。


int main()
{
	int i = 10;
	int j = 11;

	int sum = i + j;
}

  1. 10,11,(i+j)

屬於右值,因為它本身沒有記憶體地址,除非把它們放入到棧中或者堆中。

  1. i,j,sum

屬於左值,因為它們是執行緒棧上地址的標識符。

知道了 左右值 概念,接下來理解 左右值引用 就很簡單了,既然是 引用,必然是多個變數指向同一個地址,對吧,修改下程式碼如下:


int main()
{
	int i = 10;
	int& k = i;		//左值引用


	int&& m = 10;	//右值引用
}

接下來看下彙編程式碼:


    33: 	int i = 10;
00FB182F  mov         dword ptr [ebp-0Ch],0Ah  
    34: 	int& k = i;	
00FB182F  mov         dword ptr [ebp-0Ch],0Ah  
00FB1836  lea         eax,[ebp-0Ch]  
00FB1839  mov         dword ptr [ebp-18h],eax  
    36: 	int&& m = 10;	
00FB183C  mov         dword ptr [ebp-30h],0Ah  
00FB1843  lea         eax,[ebp-30h]  
00FB1846  mov         dword ptr [ebp-24h],eax 

從彙編程式碼看,它們是一模一樣的,也就是說在彙編層面,其實並沒有 右值引用左值引用 一說。

有了這些基礎,我們來看下更複雜的 class 結構。

三: 右值引用如何減少對象的創建

1. 簡要思路

其實仔細想一想,減少臨時對象的創建,無非就是在運算過程中復用一些對象,不需要每次都走賦值構造函數來進行深複製,畫個圖就像下面這樣。

明白了這個思路,接下來我們舉一個例子說明。

2. 一個簡單的例子

C++ 最煩的地方就是有太多的構造函數, 數不勝數,太尷尬了,這裡我做一個簡單的 + 操作例子。



#include <iostream>
#include <vector>

using namespace std;

class StringBuidler {
public:
	char* str;
	int length;
public:
	StringBuidler() {}
	StringBuidler(int len, char c) {
		this->str = new char[len];
		this->str[0] = c;
		this->length = len;
	}

	StringBuidler(const StringBuidler& s) {

		printf("StringBuidler:深複製 \n");
		this->length = s.length;
		this->str = new char[s.length];

		for (size_t i = 0; i < length; i++)
		{
			this->str[i] = s.str[i];
		}
	}

	StringBuidler operator+(const StringBuidler& p) {

		StringBuidler tmp;

		tmp.length = this->length + p.length;
		tmp.str = new char[tmp.length];

		int index = 0;

		for (size_t i = 0; i < this->length; i++)
		{
			tmp.str[index++] = this->str[i];
		}
		for (size_t i = 0; i < p.length; i++)
		{
			tmp.str[index++] = p.str[i];
		}

		return tmp;
	}
};

int main()
{
	StringBuidler s1(10, 'a');
	StringBuidler s2(5, 'b');

	StringBuidler s3 = s1 + s2;

	printf("s3.length=%d, s1.length=%d, s2.length=%d \n", s3.length, s1.length, s2.length);
}

從這個例子中可以看到,s1+s2 操作中出現了一次 深copy,具體程式碼出現在 return 處,彙編程式碼如下:

因為是深複製,所以會再次生成一個 new char[] ,如果 new char[] 很大,那將會是不必要的性能開銷,能不能像我畫的圖一樣,將 s3 中的 str 指針直接指向 tmp 所持有的 heap 上的 char[] 數組來達到復用目的呢? 肯定是可以的。

3. 性能優化方案

這裡需要用 右值引用 + 移動構造函數s3.str 指向 tmp.str,從而避免複製構造函數,在 StringBuilder 類中加一個方法如下:


	StringBuidler(StringBuidler&& s) {
		this->str = s.str;
		this->length = s.length;

		s.str = nullptr;
	}

然後把程式跑起來,截圖如下:

可以看到,深複製已經沒有了,這個過程會在 return 處被調用,編譯器會判斷如果是右值的話,自動走 移動構造函數,沒有這個函數就會走 賦值構造函數

四: 總結

總之 右值引用 可以讓你儘可能的復用一些中間對象,達到一個性能上的提升,其實對 C# 程式設計師來說,這麼簡單的引用賦值,C++ 搞出了這麼多概念,真的很難理解,可能還是那句話,這是 C++ 的值類型優先的基因決定的。

Tags: