「Python實用祕技08」一行程式碼解析地址資訊

費弗裡發表於2022-05-05

本文完整示例程式碼及檔案已上傳至我的Github倉庫https://github.com/CNFeffery/PythonPracticalSkills

  這是我的系列文章「Python實用祕技」的第8期,本系列立足於筆者日常工作中使用Python積累的心得體會,每一期為大家帶來一個幾分鐘內就可學會的簡單小技巧。

  作為系列第8期,我們即將學習的是:一行程式碼解析地址資訊

「Python實用祕技08」一行程式碼解析地址資訊

  在日常資料處理的過程中,有時候拿到手的是完整的地址資訊,如果需要從地址資訊中解析出相應的各級行政單元名稱,方式有很多,而今天要介紹的方式只需要一行程式碼即可快速實現。

  首先我們需要安裝jionlp這個非常好用的文字預處理工具包,建議使用國內映象安裝:

pip install jionlp -i https://pypi.douban.com/simple/

  安裝完成後,只需要使用其parse_location()介面即可進行地址資訊的解析,且具有多種不同的功能:

  • 基礎的省市區資訊提取
「Python實用祕技08」一行程式碼解析地址資訊
  • 街鎮鄉、村或居委會資訊提取

  通過設定引數town_village=True,還可以額外嘗試提取出街鎮鄉、村或居委會資訊等級別的資訊欄位:

「Python實用祕技08」一行程式碼解析地址資訊
  • 自動補全省市資訊

  若地址資訊中缺失省市資訊也無妨,在不存在歧義的情況下,parse_location()會自動關聯並補全相關資訊:

「Python實用祕技08」一行程式碼解析地址資訊

  除此之外,parse_location()還具有舊地名修正為新地名、自定義行政區劃詞典等功能,你可以在其官方文件https://github.com/dongrixinyu/JioNLP/wiki/Gadget-說明文件#地址解析中瞭解更多。


  本期分享結束,我們們下回見~?

相關文章