關於高效使用Python字典的清單

劉志軍發表於2019-03-04

字典(dict)物件是 Python 最常用的資料結構,社群曾有人開玩笑地說:”Python企圖用字典裝載整個世界”,字典在Python中的重要性不言而喻,這裡整理了幾個關於高效使用字典的清單,希望Python開發者可以在日常應用開發中合理利用,讓程式碼更加 Pythonic。

1、用 in 關鍵字檢查 key 是否存在

Python之禪中有一條開發哲學是:

There should be one– and preferably only one –obvious way to do it.

儘量找一種,最好是唯一種顯而易見的解決方案。Python2 中判斷某個 key 是否存在字典中可使用 has_key 方法,另外一種方式是使用 in 關鍵字。但是強烈推薦使用後者,因為 in 的處理速度更快,另外一個原因是 has_key 這個方法在 Python3 被移除了,要想同時相容py2和py3兩個版本的程式碼,用 in 是最好的選擇。

bad

d = {`name`: `python`}

if d.has_key(`name`):
    pass複製程式碼

good

if `name` in d:
    pass複製程式碼

2、用 get 獲取字典中的值

關於獲取字典中的值,一種簡單的方式就是用d[x]訪問該元素,但是這種情況在 key 不存在的情況下會報 KeyError 錯誤,當然你可以先用 in 操作檢查 key 是否在字典中再獲取,不過這種方式不符合 Python 之禪中說的:

Simple is better than complex.
Flat is better than nested.

好的程式碼應該是簡單易懂的,扁平的程式碼結構更加可讀。我們可以使用 get 方法來代替 if … else

bad

d = {`name`: `python`}
if `name` in d:
    print(d[`hello`])
else:
    print(`default`)複製程式碼

good

print(d.get("name", "default"))複製程式碼

3、用 setdefault 為字典中不存在的 key 設定預設值

data = [
        ("animal", "bear"),
        ("animal", "duck"),
        ("plant", "cactus"),
        ("vehicle", "speed boat"),
        ("vehicle", "school bus")
    ]複製程式碼

在做分類統計時,希望把同一型別的資料歸到字典中的某種型別中,比如上面程式碼,把相同型別的事物用列表的形式重新組裝,得到新的字典

groups = {}

>>> 
{`plant`: [`cactus`], 
 `animal`: [`bear`, `duck`], 
 `vehicle`: [`speed boat`, `school bus`]}複製程式碼

普通的方式就是先判斷 key 是否已經存在,如果不存在則要先用列表物件進行初始化,再執行後續操作。而更好的方式就是使用字典中的 setdefault 方法。

bad

for (key, value) in data:
    if key in groups:
        groups[key].append(value)
    else:
        groups[key] = [value]複製程式碼

good

groups = {}
for (key, value) in data:
    groups.setdefault(key, []).append(value)複製程式碼

setdefault 的作用是:

  1. 如果 key 存在於字典中,那麼直接返回對應的值,等效於 get 方法
  2. 如果 key 不存在字典中,則會用 setdefault 中的第二個引數作為該 key 的值,再返回該值。

4、用 defaultdict 初始化字典物件

如果不希望 d[x] 在 x 不存在時報錯,除了在獲取元素時使用 get 方法之外,另外一種方式是用 collections 模組中的 defaultdict,在初始化字典的時候指定一個函式,其實 defaultdit 是 dict 的子類。

from collections import defaultdict

groups = defaultdict(list)
for (key, value) in data:
    groups[key].append(value)複製程式碼

當 key 不存在於字典中時,list 函式將被呼叫並返回一個空列表賦值給 d[key],這樣一來,你就不用擔心呼叫 d[k] 會報錯了。

5、用 fromkeys 將列表轉換成字典

keys = {`a`, `e`, `i`, `o`, `u` }
value = []
d = dict.fromkeys(keys, value)
print(d)

>>>
{`i`: [], `u`: [], `e`: [], 
 `a`: [], `o`: []}複製程式碼

6、用字典實現 switch … case 語句

Python 中沒有 switch … case 語句,這個問題Python之父龜叔表示這個語法過去沒有,現在沒有,以後也不會有。因為Python簡潔的語法完全可以用 if … elif 實現。如果有太多的分支判斷,還可以使用字典來代替。

if arg == 0:
    return `zero`
elif arg == 1:
    return `one`
elif arg == 2:
    return "two"
else:
    return "nothing"複製程式碼

good

data = {
    0: "zero",
    1: "one",
    2: "two",
}
data.get(arg, "nothing")複製程式碼

7、使用 iteritems 迭代字典中的元素

python提供了幾種方式迭代字典中的元素,第一種是使用 items 方法:

d = {
    0: "zero",
    1: "one",
    2: "two",
}

for k, v in d.items():
    print(k, v)複製程式碼

items 方法返回的是(key ,value)組成的列表物件,這種方式的弊端是迭代超大字典的時候,記憶體瞬間會擴大兩倍,因為列表物件會一次性把所有元素載入到記憶體,更好的方式是使用 iteritems

for k, v in d.iteritems():
    print(k, v)複製程式碼

iteritems 返回的是迭代器物件,迭代器物件具有惰性載入的特性,只有真正需要的時候才生成值,這種方式在迭代過程中不需要額外的記憶體來裝載這些資料。注意 Python3 中,只有 items 方法了,它等價於 Python2 中的 iteritems,而 iteritems 這個方法名被移除了。

8、使用字典推導式

推導式是個絕妙的東西,列表推導式一出,map、filter等函式黯然失色,自 Python2.7以後的版本,此特性擴充套件到了字典和集合身上,構建字典物件無需呼叫 dict 方法。

bad

numbers = [1,2,3]
d = dict([(number,number*2) for number in numbers])複製程式碼

good

numbers = [1, 2, 3]
d = {number: number * 2 for number in numbers}複製程式碼

同步發表於:foofish.net/how-to-pyth…

歡迎公眾號:Python之禪
歡迎公眾號:Python之禪

相關文章