玩轉python字典與列表(下)

dwzb發表於2018-05-26

本文首發於知乎

本文分為如下部分

  • 列表轉置
  • 字典轉置
  • 字典列表之間的轉換
  • 總結

列表轉置

已有

l = [['a', 'b', 'c'],
     [1, 2, 3]]
複製程式碼

想得到

[('a', 1), ('b', 2), ('c', 3)]
複製程式碼

程式碼如下

[z for z in zip(*l)]
複製程式碼

zip函式在list的轉置中充當重要作用,它的基礎用法是這樣的

for z in zip(['a', 'b', 'c'], [1, 2, 3]):
    print(z)

# 輸出
('a', 1)
('b', 2)
('c', 3)
複製程式碼

字典的轉置

已有

m = {'Bob': {'age': 30, 'country': 'America'},
     'Mary': {'age': 20, 'country': 'China'},
     'Frank': {'age': 25, 'country': 'America'}}
複製程式碼

想得到

{'age': {'Bob': 30, 'Frank': 25, 'Mary': 20},
 'country': {'Bob': 'America', 'Frank': 'America', 'Mary': 'China'}}
複製程式碼

如果借用pandas直接轉置即可

>>> m = {'Bob': {'age': 30, 'country': 'America'},
...      'Mary': {'age': 20, 'country': 'China'},
...      'Frank': {'age': 25, 'country': 'America'}}
>>>
>>> import pandas as pd
>>> pd.DataFrame(m)
             Bob    Frank   Mary
age           30       25     20
country  America  America  China
>>> pd.DataFrame(m).transpose()
      age  country
Bob    30  America
Frank  25  America
Mary   20    China
>>> pd.DataFrame(m).transpose().to_dict()
{'age': {'Mary': 20, 'Bob': 30, 'Frank': 25}, 'country': {'Mary': 'China', 'Bob': 'America', 'Frank': 'America'}}
複製程式碼

如果我們單獨使用字典的知識也是可以辦到的

from collections import defaultdict
result = defaultdict(dict)
for names, infos in m.items():
    for k, v in infos.items():
        result[k].update({names: v})
        
dict(result)
複製程式碼

字典列表之間的轉換

已有

d = {'name': ['a', 'b', 'c'],
    'num': [1, 2, 3]}
複製程式碼

想要得到

[('a', 1), ('b', 2), ('c', 3)]

[{'name': 'a', 'num': 1}, 
 {'name': 'b', 'num': 2},
 {'name': 'c', 'num': 3}]
複製程式碼

兩種形式

程式碼如下

# 第一個
[z for z in zip(*d.values())]

# 第二個
[dict(zip(d.keys(), z)) for z in zip(*d.values())]
# 或
[dict(zip(d, z)) for z in zip(*d.values())]
複製程式碼

總結

首先來看一下我們遇到了哪些形式的資料

{'name' : ['a', 'b', 'c'],
 'num' : [1, 2, 3]}
 
{'Bob': {'age': 30, 'country': 'America'},
 'Mary': {'age': 20, 'country': 'China'},
 'Frank': {'age': 25, 'country': 'America'}}
 
{'age': {'Bob': 30, 'Frank': 25, 'Mary': 20},
 'country': {'Bob': 'America', 'Frank': 'America', 'Mary': 'China'}}
 
[('a', 1), ('b', 2), ('c', 3)]
[{'a', 1}, {'b', 2}, {'c', 3}]
[{'a': 1}, {'b': 2}, {'c': 3}]
[{'name': 'Bob', 'age': 30, 'country': 'America'},
 {'name': 'Mary', 'age': 20, 'country': 'China'},
 {'name': 'Frank', 'age': 25, 'country': 'America'}]
複製程式碼

下面總結一下看待字典列表的思想

  • 首先,最重要的是列表這種結構,將集合、元組都看做列表(無序等都是細枝末節)
  • 而字典可以看做特殊的列表,即對每個元素都命名了的列表,鍵是名,值相當於列表的元素

讀者可以試著使用這種思想去看上面這些資料,就會明白,為什麼某些資料直接可以用pd.DataFrame轉化為資料框,他們都相當於二維列表形成的矩陣。一個維度,如果以列表形式呈現則視為行,如果以字典形式呈現則視為列。

這些資料的相互轉化中,只要根據要生成結果的形式,記住幾個套路即可:

1.如果結果是一個字典,簡單的用字典生成式等方式不談。當值是動態更新的時候,則使用collections模組中的defaultdict設定值的型別,使用迴圈填入資料,如果值型別是list則用append方法填入,如果是dict則用update方法填入。

注:有時結果是字典會直接人為指定鍵,值用列表生成式等直接獲得,這是一種比較不通用的做法,因為需要人為指定鍵的話,就無法將其改裝為一個適合各種情況的函式了。

2.如果結果是一個列表,則用列表生成式,構造每一個元素的形式即可

3.如果涉及到了轉置問題,其實本質上都是列表的轉置,往zip函式那裡想,有時也可以用defaultdict

歡迎關注我的知乎專欄

專欄主頁:python程式設計

專欄目錄:目錄

版本說明:軟體及包版本說明

相關文章