本文完整示例程式碼及檔案已上傳至我的
Github
倉庫https://github.com/CNFeffery/PythonPracticalSkills
這是我的系列文章「Python實用祕技」的第8期,本系列立足於筆者日常工作中使用Python
積累的心得體會,每一期為大家帶來一個幾分鐘內就可學會的簡單小技巧。
作為系列第8期,我們即將學習的是:一行程式碼解析地址資訊
。
在日常資料處理的過程中,有時候拿到手的是完整的地址資訊,如果需要從地址資訊中解析出相應的各級行政單元名稱,方式有很多,而今天要介紹的方式只需要一行程式碼即可快速實現。
首先我們需要安裝jionlp
這個非常好用的文字預處理工具包,建議使用國內映象安裝:
pip install jionlp -i https://pypi.douban.com/simple/
安裝完成後,只需要使用其parse_location()
介面即可進行地址資訊的解析,且具有多種不同的功能:
- 基礎的省市區資訊提取
- 街鎮鄉、村或居委會資訊提取
通過設定引數town_village=True
,還可以額外嘗試提取出街鎮鄉、村或居委會資訊等級別的資訊欄位:
- 自動補全省市資訊
若地址資訊中缺失省市資訊也無妨,在不存在歧義的情況下,parse_location()
會自動關聯並補全相關資訊:
除此之外,parse_location()
還具有舊地名修正為新地名、自定義行政區劃詞典等功能,你可以在其官方文件https://github.com/dongrixinyu/JioNLP/wiki/Gadget-說明文件#地址解析
中瞭解更多。
本期分享結束,我們們下回見~?