「Python實用秘技08」一行代碼解析地址信息

本文完整示例代碼及文件已上傳至我的Github倉庫//github.com/CNFeffery/PythonPracticalSkills

  這是我的系列文章「Python實用秘技」的第8期,本系列立足於筆者日常工作中使用Python積累的心得體會,每一期為大家帶來一個幾分鐘內就可學會的簡單小技巧。

  作為系列第8期,我們即將學習的是:一行代碼解析地址信息

  在日常數據處理的過程中,有時候拿到手的是完整的地址信息,如果需要從地址信息中解析出相應的各級行政單元名稱,方式有很多,而今天要介紹的方式只需要一行代碼即可快速實現。

  首先我們需要安裝jionlp這個非常好用的文本預處理工具包,建議使用國內鏡像安裝:

pip install jionlp -i //pypi.douban.com/simple/

  安裝完成後,只需要使用其parse_location()接口即可進行地址信息的解析,且具有多種不同的功能:

  • 基礎的省市區信息提取

  • 街鎮鄉、村或居委會信息提取

  通過設置參數town_village=True,還可以額外嘗試提取出街鎮鄉、村或居委會信息等級別的信息字段:

  • 自動補全省市信息

  若地址信息中缺失省市信息也無妨,在不存在歧義的情況下,parse_location()會自動關聯並補全相關信息:

  除此之外,parse_location()還具有舊地名修正為新地名、自定義行政區劃詞典等功能,你可以在其官方文檔//github.com/dongrixinyu/JioNLP/wiki/Gadget-說明文檔#地址解析中了解更多。


  本期分享結束,咱們下回見~👋

Tags: