python中的import,reloa

import 作用: 導入/引入一個python標準模組,其中包括.py文件、帶有__init__.py文件的目錄。

e.g:

[python] view plaincopy 

import module_name[,module1,…]  

from module import *|child[,child1,…]  

說明:

多次重複使用import語句時,不會重新載入被指定的模組,只是把對該模組的記憶體地址給引用到本地變數環境。

測試:

a.py  

#!/usr/bin/env python    

#encoding: utf-8  

import os  

print 'in a',id(os)  

m.py  

#!/usr/bin/env python    

#encoding: utf-8  

import a   #第一次會列印a裡面的語句  

import os  #再次導入os後,其記憶體地址和a裡面的是一樣的,因此這裡只是對os的本地引用  

print 'in c',id(os)  

import a  #第二次不會列印a裡面的語句,因為沒有重新載入  

reload 作用:對已經載入的模組進行重新載入,一般用於原模組有變化等特殊情況,reload前該模組必

須已經import過。

e.g:

import os

reload(os)

說明:

reload會重新載入已載入的模組,但原來已經使用的實例還是會使用舊的模組,而新生產的實例會使用新的模組;reload後還是用原來的記憶體地址;不能支援from。。import。。格式的模組進行重新載入。

測試:

a.py  

#!/usr/bin/env python    

#encoding: utf-8  

import os  

print 'in a',id(os)  

m.py  

#!/usr/bin/env python    

#encoding: utf-8  

import a   #第一次import會列印a裡面的語句  

print id(a) #原來a的記憶體地址  

reload(a)  #第二次reload還會列印a裡面的語句,因為有重新載入  

print id(a) #reload後a的記憶體地址,和原來一樣 

擴展:上面說了,在特殊情況的下才會使用reload函數;除了原來模組文件有修改外,還有哪些情況需

要使用reload函數呢,這裡舉個例子。

#!/usr/bin/env python    

#encoding: utf-8  

import sys   #引用sys模組進來,並不是進行sys的第一次載入  

reload(sys)  #重新載入sys  

sys.setdefaultencoding('utf8')  ##調用setdefaultencoding函數  

上面的程式碼是正確的,再測試下面的程式碼

#!/usr/bin/env python    

#encoding: utf-8  

import sys     

sys.setdefaultencoding('utf8')   

上面的測試會失敗,那麼為什麼要在調用setdefaultencoding時必須要先reload一次sys模組呢?

因為這裡的import語句其實並不是sys的第一次導入語句,也就是說這裡其實可能是第二、三次進行sys

模組的import,這裡只是一個對sys的引用,只能reload才能進行重新載入;那麼為什麼要重新載入,而

直接引用過來則不能調用該函數呢?因為setdefaultencoding函數在被系統調用後被刪除了,所以通過

import引用進來時其實已經沒有了,所以必須reload一次sys模組,這樣setdefaultencoding才會為可

用,才能在程式碼里修改解釋器當前的字元編碼。試試下面的程式碼,同樣會報錯:

#!/usr/bin/env python    

#encoding: utf-8  

import sys    

reload(sys)   

sys.setdefaultencoding('utf8')    

del sys.setdefaultencoding   ##刪除原來的setdefaultencoding函數     

sys.setdefaultencoding('gb2312')  

那麼到底是誰在之前就導入sys並且調用了setdefaultencoding函數呢?

答案就在python安裝目錄的Lib文件夾下,有一個叫site.py的文件【python2.6】,在裡面可以找到

main() –> setencoding()–>sys.setdefaultencoding(encoding),因為這個site.py每次啟動python解

釋器時會自動載入,所以main函數每次都會被執行,setdefaultencoding函數一出來就已經被刪除了。

__import__   作用:同import語句同樣的功能,但__import__是一個函數,並且只接收字元串作為參

數,所以它的作用就可想而知了。其實import語句就是調用這個函數進行導入工作的,import sys 

<==>sys = __import__('sys')

e.g:

__import__(module_name[, globals[, locals[, fromlist]]]) #可選參數默認為globals(),locals(),[]

__import__('os')    

__import__('os',globals(),locals(),['path','pip'])  #等價於from os import path, pip

說明:

通常在動態載入時可以使用到這個函數,比如你希望載入某個文件夾下的所用模組,但是其下的模組名

稱又會經常變化時,就可以使用這個函數動態載入所有模組了,最常見的場景就是插件功能的支援

擴展:

既然可以通過字元串來動態導入模組,那麼是否可以通過字元串動態重新載入模組嗎?試試

reload('os')直接報錯,是不是沒有其他方式呢?雖然不能直接reload但是可以先unimport一個模組,然

後再__import__來重新載入模組。現在看看unimport操作如何實現,在Python解釋里可以通過

globals(),locals(),vars(),dir()等函數查看到當前環境下載入的模組及其位置,但是這些都只能看

不能刪除,所以無法unimport;不過除此之外還有一個地方是專門存放模組的,這就是sys.modules,

通過sys.modules可以查看所有的已載入並且成功的模組,而且比globals要多,說明默認會載入一些額

外的模組,接下來就是unimport了。

#!/usr/bin/env python    

#encoding: utf-8  

import sys  

__import__('a')      #第一次導入會列印消息  

del sys.modules['a']   #unimport  

__import__('a')    #再次導入還是會列印消息,因為已經unimport一次了  

__import__('a')    #這次就不會列印消息了  

Python在安裝時,默認的編碼是ascii,當程式中出現非ascii編碼時,python的處理常常會報這樣的錯UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128),python沒辦法處理非ascii編碼的,此時需要自己設置將python的默認編碼,一般設置為utf8的編碼格式。

查詢系統默認編碼可以在解釋器中輸入以下命令:

Python程式碼 

>>>sys.getdefaultencoding()

設置默認編碼時使用:

Python程式碼 

>>>sys.setdefaultencoding('utf8')

 可能會報AttributeError: 'module' object has no attribute 'setdefaultencoding'的錯誤,執行reload(sys),在執行以上命令就可以順利通過。

此時再執行sys.getdefaultencoding()就會發現編碼已經被設置為utf8的了,但是在解釋器里修改的編

碼只能保證當次有效,在重啟解釋器後,會發現,編碼又被重置為默認的ascii了,那麼有沒有辦法一次

性修改程式或系統的默認編碼呢。

有2種方法設置python的默認編碼:

一個解決的方案在程式中加入以下程式碼:

Python程式碼 

import sys  

reload(sys) 

sys.setdefaultencoding('utf8')  

另一個方案是在python的Libsite-packages文件夾下新建一個sitecustomize.py,內容為:

Python程式碼 

# encoding=utf8  

import sys   

reload(sys)  

sys.setdefaultencoding('utf8')  

此時重啟python解釋器,執行sys.getdefaultencoding(),發現編碼已經被設置為utf8的了,多次重啟之後,效果相同,這是因為系統在python啟動的時候,自行調用該文件,設置系統的默認編碼,而不需要每次都手動的加上解決程式碼,屬於一勞永逸的解決方法。

另外有一種解決方案是在程式中所有涉及到編碼的地方,強制編碼為utf8,即添加程式碼encode("utf8"),這種方法並不推薦使用,因為一旦少寫一個地方,將會導致大量的錯誤報告。

基本概念

在Python里有兩種類型的字元串類型:位元組字元串和Unicode的字元串,一個位元組字元串就是一個包含字

節列表。 當需要的時候,Python根據電腦默認的locale設置將位元組轉化成字元。 在Mac OX上默認的編

碼是UTF-8,但是在別的系統上,大部分是ASCII。

比如創建一個位元組字元串:

byteString = "hello world! (in my default locale)"

創建一個Unicode字元串:

unicodeString = u"hello Unicode world!"

將一個位元組字元串轉成Unicode字元串然後再轉回來:

s = "hello byte string"

u = s.decode()

backToBytes = u.encode()

以上程式碼使用的是系統默認的字元來出來轉換的。  最好的辦法就是為字元指定一個編碼:

s = "hello normal string"

u = s.decode("UTF-8" )

backToBytes = u.encode( "UTF-8" )

現在,位元組字元串s就被當成一個UTF-8位元組列表去創建一個Unicode字元串u, 下一行用UTF-8表示的字元

串u轉換成位元組字元串backToBytes.

如何判斷一個對象是字元串

比如這樣去判斷:

if isinstance( s, str ):

    pass

這樣是不對的,因為Unicode字元串將不為真. 代替的是使用通用字元串類, basestring:

if isinstance( s, basestring ):# True for both Unicode and byte strings

    pass

單獨判斷是不是Unicode字元串:

if isinstance( s, unicode ):

    pass

讀取UTF-8編碼的文件

你可以手工轉換從文件中讀取的字元串,方法很簡單:

import codecs

fileObj = codecs.open( "someFile", "r", "UTF-8" )

u = fileObj.read() # Returns a Unicode string from the UTF-8 bytes in the file

codecs模組可以處理所有的編碼轉換。

源碼的編碼聲明

Python源程式碼默認是 ASCII.可以在源文件的第一行或者是第二行作如下聲明:

# coding=UTF-8

or (using formats recognized by popular editors):

#!/usr/bin/python

# -*- coding: UTF-8 -*-

or:

#!/usr/bin/python

# vim: set fileencoding=UTF-8 :

系統編碼

前面說了,Python根據電腦默認的locale設置將位元組轉化成字元.那如何獲得系統的默認編碼:

import sys

print sys.getdefaultencoding()

更改系統的默認編碼:

import sys

reload(sys)

sys.setdefaultencoding('UTF-8')

為什麼要reload sys模組,先看下python的模組載入過程:

# python -v

# installing zipimport hook

import zipimport # builtin

# installed zipimport hook

# /usr/local/lib/python2.6/site.pyc matches /usr/local/lib/python2.6/site.py

import site # precompiled from /usr/local/lib/python2.6/site.pyc

….

Python運行的時候首先載入了site.py,在site.py文件里有這麼一段程式碼:

if hasattr(sys, "setdefaultencoding"):

    del sys.setdefaultencoding

在sys載入後,setdefaultencoding方法被刪除了,所以我們要通過重新導入sys來設置系統編碼.