翻譯 | 30個 Python3 的最佳實踐,技巧和竅門

1、使用 Python3

如果你關注 Python 的話,應該會知道 Python 2 已經於今年(2020 年)1 月 1 日正式棄用了。這份教程的很多例子都是只支援 Python 3 的,如果你還在用 Python 2.1,那也是時候與時俱進了。

2、檢查所需的最低 Python 版本

你可以在程式碼中先檢查一下你的 Python 版本,以免當前用戶的 Python 版本與你的腳本不適配。實現的程式碼很簡單:

if not sys.version_info > (2, 7):
   # berate your user for running a 10 year
   # python version
elif not sys.version_info >= (3, 5):
   # Kindly tell your user (s)he needs to upgrade
   # because you're using 3.5 features

3. Use IPython

IPython 其實就是升級版的 shell,單單是自帶的自動補全功能就值得你使用它了。不過它的優勢不止這些,它那些如魔法般的內置命令行也讓是我愛使用它的原因。這些命令有:

  • %cd—修改當前工作路徑
  • %edit—打開編輯器,並在關閉時執行你剛剛輸入的程式碼
  • %env—顯示當前環境變數
  • %pip install [pkgs]—在不離開 Shell 的情況下安裝包
  • %time and %timeit—為 Python 程式碼計時

如果你想了解更多的命令,可以參考這個網站:

//ipython.readthedocs.io/en/stable/interactive/magics.html。

還有一個有用的功能就是調取之前的命令輸出,這裡的輸入和輸出其實都是對象。例如,你可以用 Out[3] 來調取第三條命令的輸出。

你可以用下面這條命令安裝 IPython:

pip3 install ipython

4、列表表達式

有了列表表達式,你就不再需要用 for loop 來生成一個 list 了。其基本語法是這樣的:

[ expression for item in list if conditional ]

這就是一個生成包含一串數字的 list 的簡單例子。

mylist = [i for i in range(10)]
print(mylist)
# 0 1 2 3 4 5 6 7 8 9 

在這條命令里還可以使用表達式(expression),所以也可以做一些數學運算:

squares = [x**2 for x in range(10)]
print(squares)
# [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

你甚至可以調用一個外部函數:

def some_function(a):
    return (a + 5) / 2
    
my_formula = [some_function(i) for i in range(10)]
print(my_formula)
# [2.5, 3.0, 3.5, 4.0, 4.5, 5.0, 5.5, 6.0, 6.5, 7.0]

最後,你也可以在生成 list 時用 if 語句進行篩選。下面這個例子中,我們只保留了能被 2 整除的值:

filtered = [i for i in range(20) if i%2==0]
print(filtered)
# [0, 2, 4, 6, 8, 10, 12, 14, 16, 18]

5、檢查你的對象佔用了多少記憶體

你可以使用 sys.getsizeof() 來查看你創建的對象佔用的記憶體大小:

import sys

mylist = range(0, 10000)
print(sys.getsizeof(mylist))
# 48

哇,等一下,為什麼這麼大的 list 只有 48 位元組?

這是因為 range 函數只返回了一個類似 list 的類。由此可見,相較於直接使用 list,使用 range 能節省很多空間:

import sys

myreallist = [x for x in range(0, 10000)]
print(sys.getsizeof(myreallist))
# 87632

6、返回多個值

Python 的函數可以同時返回多個值,也並不需要使用 dictionary,list 或是類這樣的數據結構。它的工作機制是這樣的

def get_uset(id):
    # 從資料庫中獲取用戶
    # ...
    return name,birthdate

name,birthdate = get_user(4)

這種方式在返回值的數量很少時是可以的,但是如果返回值超過 3 個,那它們就該被放到一個(數據)類中了。

7、使用 數據類

Python 從 3.7 開始提供數據類功能。這種功能與常規的類以及其他類似的功能(返回多個值的函數以及 dictionary)相比較,有以下優勢:

  • 數據類型有最低程式碼量要求
  • 因為數據類已經自帶了__eq__功能,故而你可以直接進行數據類的對比
  • 數據類自帶__repr__,你也可以直接在 debug 時列印出一個數據類
  • 數據類型需要你輸入提示,這樣 bug 量會大大減少

下面展示了一個實用的數據類例子:

from dataclasses import dataclass

@dataclass
class Card:
    rank: str
    suit: str
    
card = Card("Q", "hearts")

print(card == card)
# True

print(card.rank)
# 'Q'

print(card)
Card(rank='Q', suit='hearts')

想更深入的了解數據類,可以參考://realpython.com/python-data-classes/

8、在位置不變的情況下交換變數

一個小技巧就可以減少很多行程式碼:

a = 1
b = 2
a, b = b, a
print(a)
# 2
print(b)
# 1

9、合併 dictionary(Python 3.5+)

從 Python 3.5 開始,dictionary 的合併變得更容易了:

dict1 = { 'a': 1, 'b': 2 }
dict2 = { 'b': 3, 'c': 4 }
merged = { **dict1, **dict2 }
print (merged)
# {'a': 1, 'b': 3, 'c': 4}

如果有重複的 key,那麼第一個詞典的這個 key 對應的值會被覆蓋掉。

10、把字元串變成標題形式

這只是 Python 中的寶藏之一:

mystring = "10 awesome python tricks"
print(mystring.title())
'10 Awesome Python Tricks'

11、把字元串分割成 list

你可以把一個字元串分割成一個 list 的字元串。下面的例子中,我們是按照空格分割字元串的:

mystring = "The quick brown fox"
mylist = mystring.split(' ')
print(mylist)
# ['The', 'quick', 'brown', 'fox']

12、將一個字元串列表變成字元串

把上一個小技巧反過來,我們也可以把一個 list 變成一個字元串,並在每個詞中間插入空格:

mylist = ['The', 'quick', 'brown', 'fox']
mystring = " ".join(mylist)
print(mystring)
# 'The quick brown fox'

你可能在想為什麼不用

mylist.join(" ")

好問題!

這是因為 String.join() 可以連接任何可迭代對象,不只是列表。在 String 中用這個函數可以防止這些操作發生在我們不想他發生的地方。

13、Emoji

1_5wWvIDF3MAJdPYEUI3InuA

這個功能有些人喜歡,有些人則很抗拒,因人而異。嚴格來說,這個功能主要好處就是在分析社交數據時可以更加方便。

首先,你要安裝 emoji 模組:

pip install emoji

安裝完後,你可以像下面這樣使用這個模組:

import emoji
result = emoji.emojize('Python is :thumbs_up:')
print(result)
# 'Python is 👍'

# You can also reverse this:
result = emoji.demojize('Python is 👍')
print(result)
# 'Python is :thumbs_up:'

想要更深入的了解 emoji 模組,可以參考://pypi.org/project/emoji/。

14、list 切片 (重要)

list 切片的基本使用形式如下:

a[start:stop:step]

Start, Stop 和 Step 都是可選參數。如果你沒有定義,它們就會按照如下規則分配默認值:

  • start = 0
  • end = 方括弧裡面字元串的最後一個字元
  • step = 1
# 我們可以輕鬆地從創建新列表
# 列表的前兩個元素:
first_two = [1, 2, 3, 4, 5][0:2]
print(first_two)
# [1, 2]

# 如果我們使用 step 值為2,
# 我們可以跳過第二個數字
# like this:
steps = [1, 2, 3, 4, 5][0:5:2]
print(steps)
# [1, 3, 5]

# 這也適用於字元串。 在Python中,
# 您可以將字元串視為
# letters:
mystring = "abcdefdn nimt"[::2]
print(mystring)
# 'aced it'

15、翻轉字元串和 list

你可以用剛剛提到的切片操作來翻轉字元串和 list。把 step 設置成-1,就成完成翻轉操作:

revstring = "abcdefg"[::-1]
print(revstring)
# 'gfedcba'

revarray = [1, 2, 3, 4, 5][::-1]
print(revarray)
# [5, 4, 3, 2, 1]

16、展示小貓的圖片

我終於還是發現了一個可以在我文章中提到小貓的機會!當然,你也可能是用這個功能來展示其他的圖。首先,你要安裝 Pillow,這是 Python Image 庫的一個分支:

pip3 install Pillow

現在把這個影像下載下來並命名為 kittens.jpg:

你可用下面這段 python 程式碼來顯示影像。

from PIL import Image

im = Image.open("kittens.jpg")
im.show()
print(im.format, im.size, im.mode)
# JPEG (1920, 1357) RGB

或者你可以直接在 IPython 上做這件事。

1_D8q1kVPE9SDdnWqOQpAMyg

Pillow 能做的可不止這些。它可以對圖片進行分析、裁剪、過濾、增強、變形等等。如果想要更深入的了解,可以去看一下它的文檔:

//pillow.readthedocs.io/en/stable/

17、使用  map()

Python 的內置函數之一就是 map()。map() 的語法如下:

所以你可以給它一個函數讓其執行,然後還要傳給它對應的參數。這個參數可以使任何可迭代對象。下面的例子里我用了 list:

def upper(s):
    return s.upper()
    
mylist = list(map(upper, ['sentence', 'fragment']))
print(mylist)
# ['SENTENCE', 'FRAGMENT']

# 轉換的字元串表示形式
# 整數列表中的數字。
list_of_ints = list(map(int, "1234567")))
print(list_of_ints)
# [1, 2, 3, 4, 5, 6, 7]

快去看看你的程式碼,是不是有的地方可以用 map() 而不是 loop!

18、從 list 或是 string 中獲取 unique 元素

你可以用 set() 來獲取 list 或是類似於 list 的對象的 unique 元素,結果返回為一個 set。

mylist = [1, 1, 2, 3, 4, 5, 5, 5, 6, 6]
print (set(mylist))
# {1, 2, 3, 4, 5, 6}

# 由於字元串可以被視為
# 字母列表,您還可以通過以下方式從字元串中獲取唯一字母:
print (set("aaabbbcccdddeeefff"))
# {'a', 'b', 'c', 'd', 'e', 'f'}

19、找到高頻值

test = [1, 2, 3, 4, 2, 2, 3, 1, 4, 4, 4]
print(max(set(test), key = test.count))
# 4

在 list 或字元創中獲取高頻值:

  • max() 會返回 list 中的最高值。而 key 可以利用一個輸入(如本例中的 test.count)來確定你要排序的方式。這個函數會應用於前面可迭代對象的每一項。
  • test.count 是 list 的內置函數。我們給它一個輸入,它會統計那個輸入的出現次數。test.count(1) 就會返回 2,test.count(4) 就會返回 4。
  • set(test) 會返回 unique 值,也就是 {1, 2, 3, 4}

所以這一行程式碼所做的事就是先找到所有的 unique 值({1, 2, 3, 4}),然後 max 就會對這四個值分別進行 list.count 操作,並返回最大值。

20、創建進度條

你可以創建你自己的進度條,也是很有意思的。但是直接使用 progress 包會快很多:

pip3 install progress

現在你可以毫不費力的創建一個進度條了:

from progress.bar import Bar

bar = Bar('Processing', max=20)
for i in range(20):
    # Do some work
    bar.next()
bar.finish()

21、在交互 shell 中使用「_」

你可以用下劃線來獲得上一條命令的輸入,在 IPython 中是這樣的:

In [1]: 3 * 3
Out[1]: 9
In [2]: _ + 3
Out[2]: 12

Python shell 中這條命令也可以用。IPython shell 中你也可以用 Out[n] 來獲得 In[n] 的輸出。比如說,在上面的例子中,Out[1] 就會返回 9。

22、快速創建一個網頁伺服器

你可以快速創建一個網頁伺服器,並將當前的路徑作為內容:

python3 -m http.server

如果你想跟你的同事分享一些東西,或者測試一些簡單的 HTML 網站,那這條命令就很有用了。

23、多行字元串

儘管你可以在程式碼中用三重引號(「 「 「 」 」 」)來存儲多行字元串,但這並不是理想的方法。你在三重引號間的所有內容都變成了字元串,如下圖所示,連格式符都變成了字元串。

我比較傾向於使用第二種方式。這種方式可以把很多行合併到一起,同時你的程式碼格式也會很好。這個方法唯一的缺點就是你要明確定義換行的位置。

s1 = """Multi line strings can be put
        between triple quotes. It's not ideal
        when formatting your code though"""

print (s1)
# Multi line strings can be put
#         between triple quotes. It's not ideal
#         when formatting your code though
        
s2 = ("You can also concatenate multiple\n" +
        "strings this way, but you'll have to\n"
        "explicitly put in the newlines")

print(s2)
# You can also concatenate multiple
# strings this way, but you'll have to
# explicitly put in the newlines

24、條件賦值的三元運算符

這是那些讓你程式碼在保證可讀性的情況下更簡潔的方法之一:

[on_true] if [expression] else [on_false]

實例如下:

x = "Success!" if (y == 2) else "Failed!"

25、統計出現數

你可以使用 collection 庫來獲得 list 中各個 unique 值的計數,並返回成一個 dictionary:

from collections import Counter

mylist = [1, 1, 2, 3, 4, 5, 5, 5, 6, 6]
c = Counter(mylist)
print(c)
# Counter({1: 2, 2: 1, 3: 1, 4: 1, 5: 3, 6: 2})

# 它也適用於字元串:
print(Counter("aaaaabbbbbccccc"))
# Counter({'a': 5, 'b': 5, 'c': 5})

26、比較符鏈(chaining of comparison operators)

Python 里,你可以把比較符連接成一條鏈,這樣程式碼會更有可讀性,而且更簡潔。

x = 10

# 代替:
if x > 5 and x < 15:
    print("Yes")
# yes

# You can also write:
if 5 < x < 15:
    print("Yes")
# Yes

27、加一些色彩

Colorama 中 Jonathan Hartley 的截屏

Colorama 中 Jonathan Hartley 的截屏

from colorama import Fore, Back, Style

print(Fore.RED + 'some red text')
print(Back.GREEN + 'and with a green background')
print(Style.DIM + 'and in dim text')
print(Style.RESET_ALL)
print('back to normal now')

28、日期計算

python-dateutil 模組對標準的 datatime 模組做了很大的擴充。先下載一下這個模組:

pip3 install python-dateutil

你可以用這個庫做很多很酷的事情。我只會給你們介紹我發現的很有用的一個例子:日誌文件中日期的模糊解析等。

from dateutil.parser import parse

logline = 'INFO 2020-01-01T00:00:01 Happy new year, human.'
timestamp = parse(logline, fuzzy=True)
print(timestamp)
# 2020-01-01 00:00:01

記住一點:基本的 Python 日期函數對一些問題束手無策的時候,這時 python-deteutil 就能發揮作用。

29、整除

Python 2 中,除號(/)默認為整除,除非其中一個被操作數是浮點數。所以你會得到這樣的結果:

# Python 2
5 / 2 = 2
5 / 2.0 = 2.5

在 Python 3 中,除號的結果默認為浮點數,而//則成為了整除的符號,所以這個時候結果變成了:

Python 3
5 / 2 = 2.5
5 // 2 = 2

如果想要深入了解這一改變,請參考://www.python.org/dev/peps/pep-0238/。

30、使用 chardet 檢測 Charset

你可以使用 chardet 模組來檢測一個文件的 charset。當你在分析大量的文本時,這個模組就會變得很有用。你可以用下面這條命令下載它:

pip install chardet

你現在會有一個命令行工具——chardetect,這個工具的使用方式是:

chardetect somefile.txt
somefile.txt: ascii with confidence 1.0

你可以以在程式中使用這個庫,詳見:

//chardet.readthedocs.io/en/latest/usage.html


這就是 30 Python Best Practices, Tips, And Tricks 的全部翻譯啦!希望大家喜歡這些技巧!

另外翻譯不易,可以的話棒部落客點個贊吧,提前感謝!!