python中的import,reloa
- 2020 年 1 月 9 日
- 筆記
import 作用: 導入/引入一個python標準模組,其中包括.py文件、帶有__init__.py文件的目錄。
e.g:
[python] view plaincopy
import module_name[,module1,…]
from module import *|child[,child1,…]
說明:
多次重複使用import語句時,不會重新載入被指定的模組,只是把對該模組的記憶體地址給引用到本地變數環境。
測試:
a.py
#!/usr/bin/env python
#encoding: utf-8
import os
print 'in a',id(os)
m.py
#!/usr/bin/env python
#encoding: utf-8
import a #第一次會列印a裡面的語句
import os #再次導入os後,其記憶體地址和a裡面的是一樣的,因此這裡只是對os的本地引用
print 'in c',id(os)
import a #第二次不會列印a裡面的語句,因為沒有重新載入
reload 作用:對已經載入的模組進行重新載入,一般用於原模組有變化等特殊情況,reload前該模組必
須已經import過。
e.g:
import os
reload(os)
說明:
reload會重新載入已載入的模組,但原來已經使用的實例還是會使用舊的模組,而新生產的實例會使用新的模組;reload後還是用原來的記憶體地址;不能支援from。。import。。格式的模組進行重新載入。
測試:
a.py
#!/usr/bin/env python
#encoding: utf-8
import os
print 'in a',id(os)
m.py
#!/usr/bin/env python
#encoding: utf-8
import a #第一次import會列印a裡面的語句
print id(a) #原來a的記憶體地址
reload(a) #第二次reload還會列印a裡面的語句,因為有重新載入
print id(a) #reload後a的記憶體地址,和原來一樣
擴展:上面說了,在特殊情況的下才會使用reload函數;除了原來模組文件有修改外,還有哪些情況需
要使用reload函數呢,這裡舉個例子。
#!/usr/bin/env python
#encoding: utf-8
import sys #引用sys模組進來,並不是進行sys的第一次載入
reload(sys) #重新載入sys
sys.setdefaultencoding('utf8') ##調用setdefaultencoding函數
上面的程式碼是正確的,再測試下面的程式碼
#!/usr/bin/env python
#encoding: utf-8
import sys
sys.setdefaultencoding('utf8')
上面的測試會失敗,那麼為什麼要在調用setdefaultencoding時必須要先reload一次sys模組呢?
因為這裡的import語句其實並不是sys的第一次導入語句,也就是說這裡其實可能是第二、三次進行sys
模組的import,這裡只是一個對sys的引用,只能reload才能進行重新載入;那麼為什麼要重新載入,而
直接引用過來則不能調用該函數呢?因為setdefaultencoding函數在被系統調用後被刪除了,所以通過
import引用進來時其實已經沒有了,所以必須reload一次sys模組,這樣setdefaultencoding才會為可
用,才能在程式碼里修改解釋器當前的字元編碼。試試下面的程式碼,同樣會報錯:
#!/usr/bin/env python
#encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf8')
del sys.setdefaultencoding ##刪除原來的setdefaultencoding函數
sys.setdefaultencoding('gb2312')
那麼到底是誰在之前就導入sys並且調用了setdefaultencoding函數呢?
答案就在python安裝目錄的Lib文件夾下,有一個叫site.py的文件【python2.6】,在裡面可以找到
main() –> setencoding()–>sys.setdefaultencoding(encoding),因為這個site.py每次啟動python解
釋器時會自動載入,所以main函數每次都會被執行,setdefaultencoding函數一出來就已經被刪除了。
__import__ 作用:同import語句同樣的功能,但__import__是一個函數,並且只接收字元串作為參
數,所以它的作用就可想而知了。其實import語句就是調用這個函數進行導入工作的,import sys
<==>sys = __import__('sys')
e.g:
__import__(module_name[, globals[, locals[, fromlist]]]) #可選參數默認為globals(),locals(),[]
__import__('os')
__import__('os',globals(),locals(),['path','pip']) #等價於from os import path, pip
說明:
通常在動態載入時可以使用到這個函數,比如你希望載入某個文件夾下的所用模組,但是其下的模組名
稱又會經常變化時,就可以使用這個函數動態載入所有模組了,最常見的場景就是插件功能的支援。
擴展:
既然可以通過字元串來動態導入模組,那麼是否可以通過字元串動態重新載入模組嗎?試試
reload('os')直接報錯,是不是沒有其他方式呢?雖然不能直接reload但是可以先unimport一個模組,然
後再__import__來重新載入模組。現在看看unimport操作如何實現,在Python解釋里可以通過
globals(),locals(),vars(),dir()等函數查看到當前環境下載入的模組及其位置,但是這些都只能看
不能刪除,所以無法unimport;不過除此之外還有一個地方是專門存放模組的,這就是sys.modules,
通過sys.modules可以查看所有的已載入並且成功的模組,而且比globals要多,說明默認會載入一些額
外的模組,接下來就是unimport了。
#!/usr/bin/env python
#encoding: utf-8
import sys
__import__('a') #第一次導入會列印消息
del sys.modules['a'] #unimport
__import__('a') #再次導入還是會列印消息,因為已經unimport一次了
__import__('a') #這次就不會列印消息了
Python在安裝時,默認的編碼是ascii,當程式中出現非ascii編碼時,python的處理常常會報這樣的錯UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128),python沒辦法處理非ascii編碼的,此時需要自己設置將python的默認編碼,一般設置為utf8的編碼格式。
查詢系統默認編碼可以在解釋器中輸入以下命令:
Python程式碼
>>>sys.getdefaultencoding()
設置默認編碼時使用:
Python程式碼
>>>sys.setdefaultencoding('utf8')
可能會報AttributeError: 'module' object has no attribute 'setdefaultencoding'的錯誤,執行reload(sys),在執行以上命令就可以順利通過。
此時再執行sys.getdefaultencoding()就會發現編碼已經被設置為utf8的了,但是在解釋器里修改的編
碼只能保證當次有效,在重啟解釋器後,會發現,編碼又被重置為默認的ascii了,那麼有沒有辦法一次
性修改程式或系統的默認編碼呢。
有2種方法設置python的默認編碼:
一個解決的方案在程式中加入以下程式碼:
Python程式碼
import sys
reload(sys)
sys.setdefaultencoding('utf8')
另一個方案是在python的Libsite-packages文件夾下新建一個sitecustomize.py,內容為:
Python程式碼
# encoding=utf8
import sys
reload(sys)
sys.setdefaultencoding('utf8')
此時重啟python解釋器,執行sys.getdefaultencoding(),發現編碼已經被設置為utf8的了,多次重啟之後,效果相同,這是因為系統在python啟動的時候,自行調用該文件,設置系統的默認編碼,而不需要每次都手動的加上解決程式碼,屬於一勞永逸的解決方法。
另外有一種解決方案是在程式中所有涉及到編碼的地方,強制編碼為utf8,即添加程式碼encode("utf8"),這種方法並不推薦使用,因為一旦少寫一個地方,將會導致大量的錯誤報告。
基本概念
在Python里有兩種類型的字元串類型:位元組字元串和Unicode的字元串,一個位元組字元串就是一個包含字
節列表。 當需要的時候,Python根據電腦默認的locale設置將位元組轉化成字元。 在Mac OX上默認的編
碼是UTF-8,但是在別的系統上,大部分是ASCII。
比如創建一個位元組字元串:
byteString = "hello world! (in my default locale)"
創建一個Unicode字元串:
unicodeString = u"hello Unicode world!"
將一個位元組字元串轉成Unicode字元串然後再轉回來:
s = "hello byte string"
u = s.decode()
backToBytes = u.encode()
以上程式碼使用的是系統默認的字元來出來轉換的。 最好的辦法就是為字元指定一個編碼:
s = "hello normal string"
u = s.decode("UTF-8" )
backToBytes = u.encode( "UTF-8" )
現在,位元組字元串s就被當成一個UTF-8位元組列表去創建一個Unicode字元串u, 下一行用UTF-8表示的字元
串u轉換成位元組字元串backToBytes.
如何判斷一個對象是字元串
比如這樣去判斷:
if isinstance( s, str ):
pass
這樣是不對的,因為Unicode字元串將不為真. 代替的是使用通用字元串類, basestring:
if isinstance( s, basestring ):# True for both Unicode and byte strings
pass
單獨判斷是不是Unicode字元串:
if isinstance( s, unicode ):
pass
讀取UTF-8編碼的文件
你可以手工轉換從文件中讀取的字元串,方法很簡單:
import codecs
fileObj = codecs.open( "someFile", "r", "UTF-8" )
u = fileObj.read() # Returns a Unicode string from the UTF-8 bytes in the file
codecs模組可以處理所有的編碼轉換。
源碼的編碼聲明
Python源程式碼默認是 ASCII.可以在源文件的第一行或者是第二行作如下聲明:
# coding=UTF-8
or (using formats recognized by popular editors):
#!/usr/bin/python
# -*- coding: UTF-8 -*-
or:
#!/usr/bin/python
# vim: set fileencoding=UTF-8 :
系統編碼
前面說了,Python根據電腦默認的locale設置將位元組轉化成字元.那如何獲得系統的默認編碼:
import sys
print sys.getdefaultencoding()
更改系統的默認編碼:
import sys
reload(sys)
sys.setdefaultencoding('UTF-8')
為什麼要reload sys模組,先看下python的模組載入過程:
# python -v
# installing zipimport hook
import zipimport # builtin
# installed zipimport hook
# /usr/local/lib/python2.6/site.pyc matches /usr/local/lib/python2.6/site.py
import site # precompiled from /usr/local/lib/python2.6/site.pyc
….
Python運行的時候首先載入了site.py,在site.py文件里有這麼一段程式碼:
if hasattr(sys, "setdefaultencoding"):
del sys.setdefaultencoding
在sys載入後,setdefaultencoding方法被刪除了,所以我們要通過重新導入sys來設置系統編碼.