對比 C++ 和 Python,談談指針與引用

  • 2019 年 10 月 8 日
  • 筆記

櫻雨樓 | 作者

豌豆花下貓 | 編輯

0 引言

指針(Pointer)是 C、C++ 以及 Java、Go 等語言的一個非常核心且重要的概念,而引用(Reference)是在指針的基礎上構建出的一個同樣重要的概念。

指針對於任何一個編程語言而言都是必須且重要的,雖然 Python 對指針這一概念進行了刻意的模糊與限制,但指針對於 Python 而言依然是一個必須進行深入討論的話題。

本文基於 C++ 與 Python,討論了 Python 中與指針及引用相關的一些行為。

1 什麼是指針?為什麼需要指針?

指針有兩重含義:

(1)指代某種數據類型的指針類型,如整形指針類型、指針指針類型

(2)指代一類存放有內存地址的變量,即指針變量

指針的這兩重含義是緊密聯繫的:作為一種變量,通過指針可以獲取某個內存地址,從而為訪問此地址上的值做好了準備;作為一種類型,其決定了內存地址的正確偏移長度,其應等於當前類型的單位內存大小。

如果一個指針缺少指針類型,即 void *,則顯然,其雖然保存了內存地址,但這僅僅是一個起點地址,指針會因為無法獲知從起點向後進行的偏移量,從而拒絕解指針操作;而如果一個指針缺少地址,即 nullptr,則其根本無法讀取特定位置的內存。

指針存在的意義主要有以下幾點:

  • 承載通過 malloc、new、allocator 等獲取的動態內存
  • 使得 pass-by-pointer 成為可能

pass-by-pointer 的好處包括但不限於:

  • 避免對實參無意義的值拷貝,大幅提高效率
  • 使得對某個變量的修改能力不局限於變量自身的作用域
  • 使得 swap、移動構造函數、移動賦值運算等操作可以僅針對數據結構內部的指針進行操作,從而避免了對臨時對象、移後源等對象的整體內存操作

由此可見,與指針相關的各操作對於編程而言都是必須的或十分重要的。

2 C++中的引用

在 C++ 中,引用具有與指針相似的性質,但更加隱形與嚴格。C++ 的引用分為以下兩種:

2.1 左值引用

左值引用於其初始化階段綁定到左值,且不存在重新綁定。

左值引用具有與被綁定左值幾乎一樣的性質,其唯一的區別在於 decltype 聲明:

int numA = 0, &lrefA = numA;  // Binding an lvalue  cout << ++lrefA << endl;      // Use the lvalue reference as lvalue & rvalue  decltype(lrefA) numB = 1;     // Error!  

左值引用常用於 pass-by-reference:

void swap(int &numA, int &numB)  {      int tmpNum = numA;      numA = numB;      numB = tmpNum;  }    int main()  {      int numA = 1, numB = 2;      swap(numA, numB);      cout << numA << endl << numB << endl;  // 2 1  }  

2.2 右值引用

右值引用於其初始化階段綁定到右值,其常用於移動構造函數和移動賦值操作。在這些場合中,移動構造函數和移動賦值操作通過右值引用接管被移動對象。

右值引用與本文內容無關,故這裡不再詳述。

3 Python中的引用

3.1 Python不存在引用

由上文討論可知,雖然「引用」對於 Python 而言是一個非常常用的術語,但這顯然是不準確的——由於 Python 不存在對左/右值的綁定操作,故不存在左值引用,更不存在右值引用。

3.2 Python的指針操作

不難發現,雖然 Python 沒有引用,但其變量的行為和指針的行為具有高度的相似性,這主要體現在以下方面:

  • 在任何情況下(包括賦值、實參傳遞等)均不存在顯式值拷貝,當此種情況發生時,只增加了一次引用計數
  • 變量可以進行重綁定(對應於一個不含頂層 const(top-level const)的指針)
  • 在某些情況下(下文將對此問題進行詳細討論),可通過函數實參修改原值

由此可見,Python變量更類似於(某種殘缺的)指針變量,而不是引用變量。

3.2.1 構造函數返回指針

對於 Python 的描述,有一句非常常見的話:「一切皆對象」。

但在這句話中,有一個很重要的事實常常被人們忽略:對象是一個值,不是一個指針或引用。

所以,這句話的準確描述應該更正為:「一切皆(某種殘缺的)指針」。雖然修改後的描述很抽象,但這是更準確的。

而由於對象從構造函數而來,至此我們可知:Python的構造函數將構造匿名對象,且返回此對象的一個指針。

這是 Python 與指針的第一個重要聯繫。

用代碼描述,對於Python代碼:

sampleNum = 0  

其不類似於 C++ 代碼:

int sampleNum = 0;  

而更類似於:

int __tmpNum = 0, *sampleNum = &__tmpNum;    // 或者:  shared_ptr<int> sampleNum(new int(0));  

3.2.2 __setitems__操作將隱式解指針

Python與指針的另一個重要聯繫在於 Python 的隱式解指針行為。

雖然 Python 不存在顯式解指針操作,但(有且僅有)__setitems__操作將進行隱式解指針,通過此方法對變量進行修改等同於通過解指針操作修改變量原值。

此種性質意味着:

  1. 任何不涉及__setitems__的操作都將成為指針重綁定。

對於Python代碼:

numList = [None] * 10    # Rebinding  numList = [None] * 5  

其相當於:

int *numList = new int[10];    // Rebinding  delete[] numList;  numList = new int[5];  delete[] numList;  

由此可見,對 numList 的非__setitems__操作,導致 numList 被綁定到了一個新指針上。

  1. 任何涉及__setitems__的操作都將成為解指針操作。

由於 Python 對哈希表的高度依賴,「涉及__setitems__的操作」在 Python 中實際上是一個非常廣泛的行為,這主要包括:

  • 對數組的索引操作
  • 對哈希表的查找操作
  • 涉及__setattr__的操作(由於 Python 將 attribute 存儲在哈希表中,所以__setattr__操作最終將是某種__setitems__操作)

我們用一個稍複雜的例子說明這一點:

對於以下Python代碼:

class Complex(object):      def __init__(self, real = 0., imag = 0.):          self.real = real          self.imag = imag        def __repr__(self):          return '(%.2f, %.2f)' % (self.real, self.imag)    def main():      complexObj = Complex(1., 2.)      complexObj.real += 1      complexObj.imag += 1      # (2.00, 3.00)      print(complexObj)    if __name__ == '__main__':      main()  

其相當於:

class Complex  {  public:      double real, imag;      Complex(double _real = 0., double _imag = 0.): real(_real), imag(_imag) {}  };    ostream &operator<<(ostream &os, const Complex &complexObj)  {      return os << "(" << complexObj.real << ", " << complexObj.imag << ")";  }    int main()  {      Complex *complexObj = new Complex(1., 2.);      complexObj->real++;      complexObj->imag++;      cout << *complexObj << endl;      delete complexObj;      return 0;  }  

由此可見,無論是 int、float 這種簡單的 Python 類型,還是我們自定義的類,其構造行為都類似使用 new 構造對象並返回指針。

且在 Python 中任何涉及「.」和「[]」的操作,都類似於對指針的「->」或「*」解指針操作。

4 後記

本文探討了 Python 變量與指針、引用兩大概念之間的關係,主要論證了「Python不存在引用」以及「Python變量的行為類似於某種殘缺的指針」兩個論點。

文中所有論點均系作者個人觀點,如有錯誤,恭迎指正。