(資料科學學習手札126)Python中JSON結構資料的高效增刪改操作

費弗裡發表於2021-08-08

本文示例程式碼及檔案已上傳至我的Github倉庫https://github.com/CNFeffery/DataScienceStudyNotes

1 簡介

  在上一期文章中我們一起學習了在Python中如何使用jsonpath庫,對JSON格式資料結構進行常規的節點條件查詢,可以滿足日常許多的資料處理需求。

  而在上一期結尾處,我提到了還有其他JSONPath功能相關的進階Python庫,在今天的文章中,我就將帶大家學習更加高階的JSON資料處理方式。

(資料科學學習手札126)Python中JSON結構資料的高效增刪改操作

2 基於jsonpath-ng的進階JSON資料處理方法

  jsonpath-ng是一個功能強大的Python庫,它整合了jsonpath-rwjsonpath-rw-ext等第三方JSONPath擴充庫的實用功能,使得我們可以基於JSONPath語法,實現更多操縱JSON資料的功能,而不只是查詢資料而已,使用pip install jsonpath-ng進行安裝:

2.1 JSON資料的增刪改

  jsonpath-ng中設計了一些方法,可以幫助我們實現對現有JSON資料的增刪改操作,首先我們來學習jsonpath-ng中如何定義JSONPath模式,並將其運用到對資料的匹配上,依然以上篇文章的資料為例:

import json
from jsonpath_ng import parse

# 讀入示例json資料
with open('json示例.json', encoding='utf-8') as j:
    demo_json = json.loads(j.read())
    
# 構造指定JSONPath模式對應的解析器
parser = parse('$..paths..steps[*].duration')

# 利用解析器的find方法找到目標資料中所有滿足條件的節點
matches = parser.find(demo_json)

# 利用value屬性取得對應匹配結果的值
matches[0].value
(資料科學學習手札126)Python中JSON結構資料的高效增刪改操作

  而基於上面產生的一些物件我們就可以實現對JSON資料的增刪改:

2.1.1 對JSON資料進行增操作

  在jsonpath-ng中對JSON資料新增節點,思想是先構造對原先不存在的節點進行匹配的解析器物件,利用find_or_create方法處理原始JSON資料:

# 構造示例資料
demo_json = {
    'level1': [
        {
            'level2': {}
        },
        {
            'level2': {
                'level3': 12
            }
        }
    ]
}

# 構造規則直譯器,所有除去最後一層節點規則外可以匹配到的節點
# 都屬於合法匹配結果,會在匹配結果列表中出現
parser = parse('level1[*].level2.level3')

matches = parser.find_or_create(demo_json)

demo_json

  在find_or_create操作之後,demo_json就被修改成下面的結果:

(資料科學學習手札126)Python中JSON結構資料的高效增刪改操作

  接下來的事情就很簡單了,只需要在matches結果中進行遍歷,遇到value屬性為{}的,就運用full_path.update_or_create()方法對原始JSON資料進行更新即可,比如這裡我們填充999:

for match in matches:
    if match.value == {}:
        # 更新原始輸入的JSON資料
        match.full_path.update_or_create(demo_json, 999)

demo_json
(資料科學學習手札126)Python中JSON結構資料的高效增刪改操作

2.1.2 對JSON資料進行刪操作

  當我們希望對JSON資料中指定JSONPath規則的節點予以刪除時,可以使用到parse物件的filter()方法傳入lambda函式,在lambda函式中進行條件判斷,返回的即為刪除指定節點之後的輸入資料。

  以上一步操作後得到的demo_json為例,我們來對其level1[*].level2.level3值為999的予以過濾:

parser = parse('level1[*].level2.level3')

# 過濾 level1[*].level2.level3 規則下值為 999 的節點
parser.filter(lambda x: x == 999, demo_json)
demo_json

  可以看到結果正是我們所預期的:

(資料科學學習手札126)Python中JSON結構資料的高效增刪改操作

2.1.3 對JSON資料進行改操作

  對JSON資料中的指定節點進行改操作非常的簡單,只需要使用parse物件的updateupdate_or_create方法即可,使用效果的區別如下所示,輕輕鬆鬆就可以完成兩種策略下的節點更新操作?:

(資料科學學習手札126)Python中JSON結構資料的高效增刪改操作

  jsonpath-ng中還有一些豐富的功能,這裡就不再贅述,感興趣的讀者朋友可以前往https://github.com/h2non/jsonpath-ng檢視。


  以上就是本文的全部內容,歡迎在評論區與我進行討論~

相關文章