Python3中datetime不同時區轉換介紹與踩坑
最近的項目需要根據用戶所屬時區制定一些特定策略,學習、應用了若干python3的時區轉換相關知識,這裡整理一部分記錄下來。
下面涉及的幾個概念及知識點:
GMT時間:Greenwich Mean Time, 格林尼治平均時間
UTC時間:Universal Time Coordinated 世界協調時,可以認為是更精準的GMT時間,但兩者誤差極小,在1s以內,一般可視為等同
LMT:Local Mean Time, 當地標準時間
Python中的北京時間:Python的標準timezone中資訊中並沒有Asia/Beijing,原因要追溯到國民政府期間上報給國際標準的五個時區城市沒有北京,因此一般使用Asia/Shanghai獲取東8區時間
Python使用到的時間相關函數及概念:
包含時區資訊的datetime稱為: offset-aware datetime,反之稱為offset-naive datetime
pytz.timezone(x): pytz package中預定義的時區相關對象, pytz可通過 python3 -m pip install pytz 安裝
datetime(…) : 直接指定year/month/day/hour/second生成naive datetime
datetime(…tzinfo=tz) : 直接指定year/month/day/hour/second+時區資訊生成offset-aware datetime
datetime.now(): 生成當前默認時區的 naive datetime
datetime.now(tzinfo=tz): 生成指定時區的offset-aware datetime
datetime.strptime(string, format) : 生成當前默認時區的string、format表示的 naive datetime
datetime.replace(tzinfo=tz): 直接替換datetime 時區資訊為tz時區offset-aware datetime–不針對時區進行任何轉換
datetime.astimezone(tz): 將時間轉換為新的tz時區的offset-aware datetime
下述程式碼示例中,由於雲主機位於日本,所以默認時區為東9區(Asia/Tokyo)
Python中獲取當前時刻時間:
In [1]: import pytz In [2]: from datetime import datetime, timedelta In [3]: datetime.now() # 默認時區當前時間 Out[3]: datetime.datetime(2021, 8, 1, 18, 36, 8, 352873) In [4]: datetime.now(pytz.timezone('Asia/Tokyo')) # 指定Tokyo時區當前時間 Out[4]: datetime.datetime(2021, 8, 1, 18, 36, 25, 421048, tzinfo=<DstTzInfo 'Asia/Tokyo' JST+9:00:00 STD>)
可以看到,datetime.now()未指定時區時,獲取到的對象是offset-navie datetime,而指定時區後則是offset-aware datetime,naive和aware的datetime是不可以執行比較、相減相關操作的,只有同類型的datetime才能求時間差值、比較大小,如下:
In [5]: datetime.now() - datetime.now(pytz.timezone('Asia/Tokyo')) --------------------------------------------------------------------------- TypeError Traceback (most recent call last) <ipython-input-5-8b6c111dc5de> in <module> ----> 1 datetime.now() - datetime.now(pytz.timezone('Asia/Tokyo')) TypeError: can't subtract offset-naive and offset-aware datetimes In [6]: datetime.now() - datetime.now() # 只有同樣的offset-naive datetime才能求差值 Out[6]: datetime.timedelta(days=-1, seconds=86399, microseconds=999991)
In [8]: datetime.now(pytz.timezone('Asia/Tokyo')) - datetime.now(pytz.timezone('Asia/Tokyo')) # 同樣的offset-aware datetime才能求差值
Out[8]: datetime.timedelta(days=-1, seconds=86399, microseconds=999976)
這裡碰到了第一個坑,比如我們想獲得北京時間2021年1月1日0點的datetime,然後將其轉換為東京時間,直覺上我們很可能這麼寫:
In [19]: datetime(2021, 1, 1, tzinfo=pytz.timezone('Asia/Shanghai')) # 這裡獲取北京時間20210101 0點的datetime Out[19]: datetime.datetime(2021, 1, 1, 0, 0, tzinfo=<DstTzInfo 'Asia/Shanghai' LMT+8:06:00 STD>) # 注意獲取的是LMT時間 In [21]: datetime(2021, 1, 1, tzinfo=pytz.timezone('Asia/Shanghai')).astimezone(pytz.timezone('Asia/Tokyo')) # 將北京時轉換為東京時間 Out[21]: datetime.datetime(2021, 1, 1, 0, 54, tzinfo=<DstTzInfo 'Asia/Tokyo' JST+9:00:00 STD>) # 獲取的是日本標準時間JST+9
In [22]: datetime.now(pytz.timezone('Asia/Shanghai')) # 示例獲取當前時刻北京時間
Out[22]: datetime.datetime(2021, 8, 1, 18, 11, 6, 706727, tzinfo=<DstTzInfo 'Asia/Shanghai' CST+8:00:00 STD>) # 獲取的是中國標準時間(CST+8)
仔細一看,北京時間的0點轉化為東京時間卻是0:54,相差是54分鐘,而不是1個小時,這就奇怪了,仔細一看tzinfo中的資訊是LMT+8:06:00 STD,表示這是LMT時間,相比UTC快8小時6分鐘,而不是東8區標準時間,而通過astimezone方法轉換後得到的就是日本標準時間(東9區),所以兩者之前的差值並不是1小時整。
第一個坑究其原因,通過datetime(..tzinfo=..)指定時區獲取的是LMT,而datetime.now(tz)、datetime.astimezone(tz) 獲取的卻是UTC(GMT)標準時間,LMT和GMT標準時間可能會有甚至十分鐘級的差值,這已經足夠影響到程式的正常邏輯了。
所以如果要保證獲取標準時區的時間,建議避免使用Asia/Shanghai、Asia/Tokyo這類大洲/城市 字元串表示時間,而使用GMT、UTC這些無歧義的標準時區,如下:
In [45]: datetime(2021, 1, 1, tzinfo=pytz.timezone('Etc/GMT-9'))
Out[45]: datetime.datetime(2021, 1, 1, 0, 0, tzinfo=<StaticTzInfo 'Etc/GMT-9'>) # 東9區應使用GMT-9
這裡第二個坑出現了,由於歷史原因,Python中timezone的表示中,時區偏移以西為正,以東為負,和我們熟悉的ISO標準剛好相反,所以東9區應該表示為Etc/GMT-9, 而Etc/GMT+9表示的其實是西9區,如下可以驗證GMT-9與JST相差0, GMT+9與JST相差18小時(64800s):
In [50]: datetime(2021, 1, 1, tzinfo=pytz.timezone('Etc/GMT-9')) - datetime(2021, 1, 1).astimezone(pytz.timezone('Asia/Tokyo')) Out[50]: datetime.timedelta(0) In [51]: datetime(2021, 1, 1, tzinfo=pytz.timezone('Etc/GMT+9')) - datetime(2021, 1, 1).astimezone(pytz.timezone('Asia/Tokyo')) Out[51]: datetime.timedelta(seconds=64800)
最後,獲取指定時區2021年1月1日datetime的方式,以北京時間為例:
In [56]: datetime(2021, 1, 1, tzinfo=pytz.timezone('Etc/GMT-8')) Out[56]: datetime.datetime(2021, 1, 1, 0, 0, tzinfo=<StaticTzInfo 'Etc/GMT-8'>)
In [58]: datetime(2021, 1, 1, tzinfo=pytz.timezone('Etc/GMT-8')).astimezone(pytz.timezone('Asia/Shanghai'))
Out[58]: datetime.datetime(2021, 1, 1, 0, 0, tzinfo=<DstTzInfo 'Asia/Shanghai' CST+8:00:00 STD>) # 可見GMT-8和東八區標準時間(CST+8)一致
進一步如果要獲取指定時區零點的時間戳就很簡單了:
In [44]: datetime(2021, 1, 1, tzinfo=pytz.timezone('Etc/GMT0')).timestamp() # 獲取格林尼治時區2021年1月1日0點時間戳 Out[44]: 1609459200.0
另外兩種獲取指定時區時刻的方法,此三種方式彼此等價:
In [51]: datetime(2021, 1, 1, tzinfo=pytz.timezone('Etc/GMT0')) == datetime(2021, 1, 1).replace(tzinfo=pytz.timezone('Etc/GMT0')) Out[51]: True In [53]: datetime(2021, 1, 1, tzinfo=pytz.timezone('Etc/GMT0')) == datetime.strptime('20210101', '%Y%m%d').replace(tzinfo=pytz.timezone('Etc/GMT0'))