­

為什麼 Python 的 f-string 可以連接字元串與數字?

本文出自「Python為什麼」系列,歸檔在 Github 上://github.com/chinesehuazhou/python-whydo

毫無疑問,Python 是一門強類型語言。強類型語言。強類型語言!(關於強弱類型話題,推薦閱讀這篇 技術科普文

這就意味著,不同類型的對象通常需要先做顯式地類型轉化, 然後才能進行某些操作。

下面以字元串和數字為例,看看強行操作會產生什麼結果:

>>> "Python貓" + 666
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: can only concatenate str (not "int") to str

它報類型錯誤了(TypeError),說字元串只能連接(concatenate)字元串,不能連接 int 類型。 這正是強類型語言的基本約束。

但是,如果我們先把數字「轉化」成字元串類型,再執行「+」操作,就不會報錯了:

>>> "Python貓" + str(666)
'Python貓666'

上面的這個例子,對讀者們來說,應該並不難理解。

由此,我們要引出一個問題:如何在不作顯式類型轉化的情況下,進行字元串與數字類型的拼接呢?

在《詳解Python拼接字元串的七種方式》這篇文章中,它梳理了七種拼接字元串的寫法,我們可以逐個來試驗一下。

幾種字元串拼接方式:

1、格式化類:%、format()、template

2、拼接類:+、()、join()

3、插值類:f-string

為了節省篇幅,此處直接把可以順利拼接的 4 種寫法羅列如下:

>>> "%s %d" % ("Python貓", 666)
'Python貓 666'

>>> from string import Template
>>> s = Template('${s1}${s2}')
>>> s.safe_substitute(s1='Python貓',s2=666)
'Python貓666'

>>> "Python貓{}".format(666)
'Python貓666'

>>> num = 666
>>> f"Python貓{num}"
'Python貓666'

第一種寫法(即 % 格式化)來自古老的 C 語言,其中的「%d」是一個佔位符,表示它將要接收一個整數,並格式化成字元串。

第二和第三種寫法,它們是第一種寫法的升級版,不同的是,它們的佔位符是通用型的,不必指定「%s」、「%d」等等明確的類型。這兩種寫法中,數字類型的參數被傳給特定的格式化方法(即 safe_substitute 與 format),在這些方法的內部,它們會作類型轉化處理。

可以說,上述三種寫法都不難理解,它們的意圖都有跡可循。

但是,現在再看看最後一種寫法,也就是 f-string 寫法,似乎就不是那麼明顯了。

首先,在字元串內部,它並沒有像「%格式化」那樣指定佔位符的類型;其次,所要拼接的數字並沒有作為任何函數的參數來傳遞。

也就是說,在明面上根本看不出任何要作類型轉化的意圖。但是,由於我們已知 Python 是強類型語言,已知數字類型絕對不可能直接拼接到字元串里,因此,只能說明 f-string 語法在底層作了某種類型轉化的操作!

那麼,我們就可以再提出一個新的問題:f-string 語法在處理字元串與數字時,是如何實現數字的類型轉化的呢?

也許有的讀者會猜想它是調用了內置的 str() 或 repr()(或它們對應的魔術方法__str__() 與 __repr__()),從而實現類型轉化,但是,答案並沒有如此簡單!

f-string 語法是在 Python 3.6 版本引入的。為了省事,我們直接找到 PEP-498 文檔,在裡面查閱看是否有關於實現原理的線索。

文檔地址://www.python.org/dev/peps/pep-0498

PEP 里提到,f-string 的語法格式是這樣的:

f'<text> { <expression> <optional !s, !r, or !a> <optional : format specifier> } <text> ...'

其中,花括弧里的內容就是要作格式化的內容,除去可選的「optional」部分後,「expression」部分就是真正要處理的內容。對應前文的例子,數字 666 就是一個 expression。

expression 會按 __format__ 協議進行格式化,但是並不會直接調用 __format__() 這個方法。

文檔上指出,實際的執行過程等效於type(value).__format__(value, format_spec) 或者 format(value, format_spec)

事實上,字元串對象的 foramt() 方法跟 Python 內置的 foramt() 函數,它們都會調用__format__() 魔術方法,所以,f-string 其實是前文中 format() 格式化寫法的升級版。

在默認情況下,format_spec 是一個空字元串,而format(value, "") 的效果等同於str(value) ,因此,在不指定其它 format_spec 的情況下,可以簡單地認為 f-string 就是調用了 str() 來作的類型轉化……

至此,我們看到了 f-string 的實現原理,明白了它在拼接字元串與數字時,效果等效於前文的 format() 格式化方法,也等效於使用 str() 進行類型轉化。

寫在最後:本文屬於「Python為什麼」系列(Python貓出品),該系列主要關注 Python 的語法、設計和發展等話題,以一個個「為什麼」式的問題為切入點,試著展現 Python 的迷人魅力。更多精彩文章,請移步 Github 查看,項目地址://github.com/chinesehuazhou/python-whydo