為什麼說 Python 內置函數並不是萬能的？

2020 年 10 月 18 日
筆記
Python無止境

本文出自「Python為什麼」系列，請查看全部文章

在Python貓的上一篇文章中，我們對比了兩種創建列表的方法，即字面量用法 [] 與內置類型用法 list()，進而分析出它們在運行速度上的差異。

在分析為什麼 list() 會更慢的時候，文中說到它需要經過名稱查找與函數調用兩個步驟，那麼，這就引出了一個新的問題：list() 不是內置類型么，為什麼它不能直接就調用創建列表的邏輯呢？也就是說，為什麼解釋器必須經過名稱查找，才能「認識」到該做什麼呢？

其實原因很簡單：內置函數/內置類型的名稱並不是關鍵字，它們只是解釋器內置的一種便捷功能，方便開發者開箱即用而已。

PS：內置函數 built-in function 和內置類型 built-in type 很相似，但 list() 實際是一種內置類型而不是內置函數。我曾對這兩種易混淆的概念做過辨析，請查看這篇文章。為了方便理解與表述，以下統稱為內置函數。

1、內置函數的查找優先順序最低

內置函數的名稱並不屬於關鍵字，它們是可以被重新賦值的。

比如下面這個例子：

# 正常調用內置函數
list(range(3))  # 結果：[0, 1, 2]

# 定義任意函數，然後賦值給 list
def test(n):
    print("Hello World!")
list = test
list(range(3)) # 結果：Hello World！

在這個例子中，我們將自定義的 test 賦值給了 list，程式並沒有報錯。這個例子甚至還可以改成直接定義新的同名函數，即”def list(): …”。

這說明了 list 並不是 Python 限定的關鍵字/保留字。

查看官方文檔，可以發現 Python 3.9 有 35 個關鍵字，明細如下：

如果我們將上例的 test 賦值給任意一個關鍵字，例如”pass=test”，就會報錯：SyntaxError: invalid syntax。

由此，我們可以從這個角度看出內置函數並不是萬能的：它們的名稱並不像關鍵字那般穩固不變，雖然它們處在系統內置作用域里，但是卻可以被用戶局部作用域的對象所輕鬆攔截掉！

因為解釋器查找名稱的順序是「局部作用域->全局作用域->內置作用域」，因此內置函數其實是處在最低優先順序。

對於新手來說，這有一定的可能會發生意想不到的情況（內置函數有 69 個，要全記住是有難度的）。

那麼，為什麼 Python 不把所有內置函數的名稱都設為不可複寫的關鍵字呢？

一方面原因是它想控制關鍵字的數量，另一方面可能是想留給用戶更多的自由。內置函數只是解釋器的推薦實現而已，開發者可以根據需要，實現出與內置函數同名的函數。

不過，這樣的場景極少，而且開發者一般會定義成不同名的函數，以 Python 標準庫為例，ast模組有 literal_eval() 函數（對標 eval() 內置函數）、pprint 模組有 pprint() 函數（對標 print() 內置函數）、以及itertools模組有 zip_longest() 函數（對標 zip() 內置函數）……

2、內置函數可能不是最快的

由於內置函數的名稱並非保留的關鍵字，以及它處於名稱查找的末位順序，所以內置函數有可能不是最快的。

上篇文章展示了 [] 比 list() 快 2~3 倍的事實，其實這還可以推廣到 str()、tuple()、set()、dict() 等等內置類型中，都是字面量用法稍稍快於內置類型用法。

對於這些內置類型，當我們調用 xxx() 時，可以簡單理解成正在做類的實例化。在面向對象語言中，類先實例化再使用，這是再正常不過的。

但是，這樣的做法有時也顯得繁瑣。為了方便使用，Python 給一些常用的內置類型提供了字面量表示法，也就是””、[]、()、{} 等等，表示字元串、列表、元組和字典等數據類型。

文檔出處：//docs.python.org/3/reference/lexical_analysis.html#delimiters

一般而言，所有程式語言都必須有一些字面量表示，但基本都局限在數字類型、字元串、布爾類型以及 null 之類的基礎類型。

Python 中還增加了幾種數據結構類型的字面量，所以是更為方便的，同時這也解釋了為什麼內置函數可能不是最快的。

一般而言，同樣的完備功能，內置函數總是比我們自定義的函數要快，因為解釋器可以做一些底層的優化，例如 len() 內置函數肯定比用戶定義的 x.len() 函數快。

有些人據此形成了「內置函數總是更快」的認識誤區。

解釋器內置函數相對於用戶定義函數，前者接近於走後門；而字面量表示法相對於內置函數，前者是在走更快的後門。

也就是說，在有字面量表示法的情況下，某些內置函數/內置類型並不是最快的！

小結

誠然，Python 本身並不是萬能的，那它的任何語法構成部分（內置函數/類型），就更不是萬能的了。但是，一般我們會認為內置函數/類型總歸是「高人一等」的，是受到諸多特殊優待的，顯得像是「萬能的」。

本文從「list() 竟然會敗給 []」破題，從兩個角度揭示了內置函數其實存在著某種不足：內置函數的名稱並不是關鍵字，而內置作用域位於名稱查找的最低優先順序，因此在調用時，某些內置函數/類型的執行速度就明顯慢於它們對應的字面量表示法。

本文對上一個「Python為什麼」話題做了延展討論，一方面充實了前面的內容，另一方面，也有助於大家理解 Python 的幾個基礎概念及其實現。

如果你喜歡本文，請點贊支援下吧！另外，我還寫了 20+ 篇類似的話題，請關注Python貓查看，並在 Github 上給我一顆小星星吧~~

—>>>最後是福利時刻：

我把兩年寫作的 100 多篇精品文章集結成了一本 700 多頁的《優雅的Python》電子書，誠意推薦！！請在微信關注Python貓 ，回復「優雅」兩字獲取~~

Tags: Python無止境