「Python實用秘技08」一行代碼解析地址信息
本文完整示例代碼及文件已上傳至我的
Github
倉庫//github.com/CNFeffery/PythonPracticalSkills
這是我的系列文章「Python實用秘技」的第8期,本系列立足於筆者日常工作中使用Python
積累的心得體會,每一期為大家帶來一個幾分鐘內就可學會的簡單小技巧。
作為系列第8期,我們即將學習的是:一行代碼解析地址信息
。

在日常數據處理的過程中,有時候拿到手的是完整的地址信息,如果需要從地址信息中解析出相應的各級行政單元名稱,方式有很多,而今天要介紹的方式只需要一行代碼即可快速實現。
首先我們需要安裝jionlp
這個非常好用的文本預處理工具包,建議使用國內鏡像安裝:
pip install jionlp -i //pypi.douban.com/simple/
安裝完成後,只需要使用其parse_location()
接口即可進行地址信息的解析,且具有多種不同的功能:
- 基礎的省市區信息提取

- 街鎮鄉、村或居委會信息提取
通過設置參數town_village=True
,還可以額外嘗試提取出街鎮鄉、村或居委會信息等級別的信息字段:

- 自動補全省市信息
若地址信息中缺失省市信息也無妨,在不存在歧義的情況下,parse_location()
會自動關聯並補全相關信息:

除此之外,parse_location()
還具有舊地名修正為新地名、自定義行政區劃詞典等功能,你可以在其官方文檔//github.com/dongrixinyu/JioNLP/wiki/Gadget-說明文檔#地址解析
中了解更多。
本期分享結束,咱們下回見~👋