對比 C++ 和 Python,談談指針與引用
- 2019 年 10 月 8 日
- 筆記
櫻雨樓 | 作者
豌豆花下貓 | 編輯
0 引言
指針(Pointer)是 C、C++ 以及 Java、Go 等語言的一個非常核心且重要的概念,而引用(Reference)是在指針的基礎上構建出的一個同樣重要的概念。
指針對於任何一個編程語言而言都是必須且重要的,雖然 Python 對指針這一概念進行了刻意的模糊與限制,但指針對於 Python 而言依然是一個必須進行深入討論的話題。
本文基於 C++ 與 Python,討論了 Python 中與指針及引用相關的一些行為。

1 什麼是指針?為什麼需要指針?
指針有兩重含義:
(1)指代某種數據類型的指針類型,如整形指針類型、指針指針類型
(2)指代一類存放有內存地址的變量,即指針變量
指針的這兩重含義是緊密聯繫的:作為一種變量,通過指針可以獲取某個內存地址,從而為訪問此地址上的值做好了準備;作為一種類型,其決定了內存地址的正確偏移長度,其應等於當前類型的單位內存大小。
如果一個指針缺少指針類型,即 void *,則顯然,其雖然保存了內存地址,但這僅僅是一個起點地址,指針會因為無法獲知從起點向後進行的偏移量,從而拒絕解指針操作;而如果一個指針缺少地址,即 nullptr,則其根本無法讀取特定位置的內存。
指針存在的意義主要有以下幾點:
- 承載通過 malloc、new、allocator 等獲取的動態內存
- 使得 pass-by-pointer 成為可能
pass-by-pointer 的好處包括但不限於:
- 避免對實參無意義的值拷貝,大幅提高效率
- 使得對某個變量的修改能力不局限於變量自身的作用域
- 使得 swap、移動構造函數、移動賦值運算等操作可以僅針對數據結構內部的指針進行操作,從而避免了對臨時對象、移後源等對象的整體內存操作
由此可見,與指針相關的各操作對於編程而言都是必須的或十分重要的。

2 C++中的引用
在 C++ 中,引用具有與指針相似的性質,但更加隱形與嚴格。C++ 的引用分為以下兩種:
2.1 左值引用
左值引用於其初始化階段綁定到左值,且不存在重新綁定。
左值引用具有與被綁定左值幾乎一樣的性質,其唯一的區別在於 decltype 聲明:
int numA = 0, &lrefA = numA; // Binding an lvalue cout << ++lrefA << endl; // Use the lvalue reference as lvalue & rvalue decltype(lrefA) numB = 1; // Error!
左值引用常用於 pass-by-reference:
void swap(int &numA, int &numB) { int tmpNum = numA; numA = numB; numB = tmpNum; } int main() { int numA = 1, numB = 2; swap(numA, numB); cout << numA << endl << numB << endl; // 2 1 }
2.2 右值引用
右值引用於其初始化階段綁定到右值,其常用於移動構造函數和移動賦值操作。在這些場合中,移動構造函數和移動賦值操作通過右值引用接管被移動對象。
右值引用與本文內容無關,故這裡不再詳述。
3 Python中的引用
3.1 Python不存在引用
由上文討論可知,雖然「引用」對於 Python 而言是一個非常常用的術語,但這顯然是不準確的——由於 Python 不存在對左/右值的綁定操作,故不存在左值引用,更不存在右值引用。
3.2 Python的指針操作
不難發現,雖然 Python 沒有引用,但其變量的行為和指針的行為具有高度的相似性,這主要體現在以下方面:
- 在任何情況下(包括賦值、實參傳遞等)均不存在顯式值拷貝,當此種情況發生時,只增加了一次引用計數
- 變量可以進行重綁定(對應於一個不含頂層 const(top-level const)的指針)
- 在某些情況下(下文將對此問題進行詳細討論),可通過函數實參修改原值
由此可見,Python變量更類似於(某種殘缺的)指針變量,而不是引用變量。

3.2.1 構造函數返回指針
對於 Python 的描述,有一句非常常見的話:「一切皆對象」。
但在這句話中,有一個很重要的事實常常被人們忽略:對象是一個值,不是一個指針或引用。
所以,這句話的準確描述應該更正為:「一切皆(某種殘缺的)指針」。雖然修改後的描述很抽象,但這是更準確的。
而由於對象從構造函數而來,至此我們可知:Python的構造函數將構造匿名對象,且返回此對象的一個指針。
這是 Python 與指針的第一個重要聯繫。
用代碼描述,對於Python代碼:
sampleNum = 0
其不類似於 C++ 代碼:
int sampleNum = 0;
而更類似於:
int __tmpNum = 0, *sampleNum = &__tmpNum; // 或者: shared_ptr<int> sampleNum(new int(0));
3.2.2 __setitems__操作將隱式解指針
Python與指針的另一個重要聯繫在於 Python 的隱式解指針行為。
雖然 Python 不存在顯式解指針操作,但(有且僅有)__setitems__操作將進行隱式解指針,通過此方法對變量進行修改等同於通過解指針操作修改變量原值。
此種性質意味着:
- 任何不涉及__setitems__的操作都將成為指針重綁定。
對於Python代碼:
numList = [None] * 10 # Rebinding numList = [None] * 5
其相當於:
int *numList = new int[10]; // Rebinding delete[] numList; numList = new int[5]; delete[] numList;
由此可見,對 numList 的非__setitems__操作,導致 numList 被綁定到了一個新指針上。
- 任何涉及__setitems__的操作都將成為解指針操作。
由於 Python 對哈希表的高度依賴,「涉及__setitems__的操作」在 Python 中實際上是一個非常廣泛的行為,這主要包括:
- 對數組的索引操作
- 對哈希表的查找操作
- 涉及__setattr__的操作(由於 Python 將 attribute 存儲在哈希表中,所以__setattr__操作最終將是某種__setitems__操作)
我們用一個稍複雜的例子說明這一點:
對於以下Python代碼:
class Complex(object): def __init__(self, real = 0., imag = 0.): self.real = real self.imag = imag def __repr__(self): return '(%.2f, %.2f)' % (self.real, self.imag) def main(): complexObj = Complex(1., 2.) complexObj.real += 1 complexObj.imag += 1 # (2.00, 3.00) print(complexObj) if __name__ == '__main__': main()

其相當於:
class Complex { public: double real, imag; Complex(double _real = 0., double _imag = 0.): real(_real), imag(_imag) {} }; ostream &operator<<(ostream &os, const Complex &complexObj) { return os << "(" << complexObj.real << ", " << complexObj.imag << ")"; } int main() { Complex *complexObj = new Complex(1., 2.); complexObj->real++; complexObj->imag++; cout << *complexObj << endl; delete complexObj; return 0; }
由此可見,無論是 int、float 這種簡單的 Python 類型,還是我們自定義的類,其構造行為都類似使用 new 構造對象並返回指針。
且在 Python 中任何涉及「.」和「[]」的操作,都類似於對指針的「->」或「*」解指針操作。
4 後記
本文探討了 Python 變量與指針、引用兩大概念之間的關係,主要論證了「Python不存在引用」以及「Python變量的行為類似於某種殘缺的指針」兩個論點。
文中所有論點均系作者個人觀點,如有錯誤,恭迎指正。