本文首發於知乎
本文分為如下部分
- 列表轉置
- 字典轉置
- 字典列表之間的轉換
- 總結
列表轉置
已有
l = [['a', 'b', 'c'],
[1, 2, 3]]
複製程式碼
想得到
[('a', 1), ('b', 2), ('c', 3)]
複製程式碼
程式碼如下
[z for z in zip(*l)]
複製程式碼
zip
函式在list的轉置中充當重要作用,它的基礎用法是這樣的
for z in zip(['a', 'b', 'c'], [1, 2, 3]):
print(z)
# 輸出
('a', 1)
('b', 2)
('c', 3)
複製程式碼
字典的轉置
已有
m = {'Bob': {'age': 30, 'country': 'America'},
'Mary': {'age': 20, 'country': 'China'},
'Frank': {'age': 25, 'country': 'America'}}
複製程式碼
想得到
{'age': {'Bob': 30, 'Frank': 25, 'Mary': 20},
'country': {'Bob': 'America', 'Frank': 'America', 'Mary': 'China'}}
複製程式碼
如果借用pandas直接轉置即可
>>> m = {'Bob': {'age': 30, 'country': 'America'},
... 'Mary': {'age': 20, 'country': 'China'},
... 'Frank': {'age': 25, 'country': 'America'}}
>>>
>>> import pandas as pd
>>> pd.DataFrame(m)
Bob Frank Mary
age 30 25 20
country America America China
>>> pd.DataFrame(m).transpose()
age country
Bob 30 America
Frank 25 America
Mary 20 China
>>> pd.DataFrame(m).transpose().to_dict()
{'age': {'Mary': 20, 'Bob': 30, 'Frank': 25}, 'country': {'Mary': 'China', 'Bob': 'America', 'Frank': 'America'}}
複製程式碼
如果我們單獨使用字典的知識也是可以辦到的
from collections import defaultdict
result = defaultdict(dict)
for names, infos in m.items():
for k, v in infos.items():
result[k].update({names: v})
dict(result)
複製程式碼
字典列表之間的轉換
已有
d = {'name': ['a', 'b', 'c'],
'num': [1, 2, 3]}
複製程式碼
想要得到
[('a', 1), ('b', 2), ('c', 3)]
[{'name': 'a', 'num': 1},
{'name': 'b', 'num': 2},
{'name': 'c', 'num': 3}]
複製程式碼
兩種形式
程式碼如下
# 第一個
[z for z in zip(*d.values())]
# 第二個
[dict(zip(d.keys(), z)) for z in zip(*d.values())]
# 或
[dict(zip(d, z)) for z in zip(*d.values())]
複製程式碼
總結
首先來看一下我們遇到了哪些形式的資料
{'name' : ['a', 'b', 'c'],
'num' : [1, 2, 3]}
{'Bob': {'age': 30, 'country': 'America'},
'Mary': {'age': 20, 'country': 'China'},
'Frank': {'age': 25, 'country': 'America'}}
{'age': {'Bob': 30, 'Frank': 25, 'Mary': 20},
'country': {'Bob': 'America', 'Frank': 'America', 'Mary': 'China'}}
[('a', 1), ('b', 2), ('c', 3)]
[{'a', 1}, {'b', 2}, {'c', 3}]
[{'a': 1}, {'b': 2}, {'c': 3}]
[{'name': 'Bob', 'age': 30, 'country': 'America'},
{'name': 'Mary', 'age': 20, 'country': 'China'},
{'name': 'Frank', 'age': 25, 'country': 'America'}]
複製程式碼
下面總結一下看待字典列表的思想
- 首先,最重要的是列表這種結構,將集合、元組都看做列表(無序等都是細枝末節)
- 而字典可以看做特殊的列表,即對每個元素都命名了的列表,鍵是名,值相當於列表的元素
讀者可以試著使用這種思想去看上面這些資料,就會明白,為什麼某些資料直接可以用pd.DataFrame
轉化為資料框,他們都相當於二維列表形成的矩陣。一個維度,如果以列表形式呈現則視為行,如果以字典形式呈現則視為列。
這些資料的相互轉化中,只要根據要生成結果的形式,記住幾個套路即可:
1.如果結果是一個字典,簡單的用字典生成式等方式不談。當值是動態更新的時候,則使用collections
模組中的defaultdict
設定值的型別,使用迴圈填入資料,如果值型別是list則用append
方法填入,如果是dict則用update
方法填入。
注:有時結果是字典會直接人為指定鍵,值用列表生成式等直接獲得,這是一種比較不通用的做法,因為需要人為指定鍵的話,就無法將其改裝為一個適合各種情況的函式了。
2.如果結果是一個列表,則用列表生成式,構造每一個元素的形式即可
3.如果涉及到了轉置問題,其實本質上都是列表的轉置,往zip
函式那裡想,有時也可以用defaultdict
歡迎關注我的知乎專欄
專欄主頁:python程式設計
專欄目錄:目錄
版本說明:軟體及包版本說明