歡迎關注我的微信公眾號 AlwaysBeta,更多精彩內容等你來。
以下測試程式碼全部基於 Python3。
Python 提供了大量的內建資料結構,包括列表,集合以及字典。在工作和編碼中,可以說天天和它們打交道,經常碰到查詢,排序和過濾等等這些問題,雖然每次解決這些問題並不困難,但總感覺程式碼寫的很麻煩,不夠優雅。
最近通過閱讀《Python3 CookBook》,瞭解了一些更優秀的方法,做一些簡單記錄,與大家分享。
1、解壓可迭代物件賦值給多個變數
我們都知道,一個序列是可以賦值給多個變數的,就像下面這樣:
In [7]: p = (1, 2, 3)
In [8]: x, y, z = p
In [9]: x
Out[9]: 1
複製程式碼
但如果接收的變數個數和序列元素個數不一致,就會報錯,如果你不知道元素個數的話,可以採用下面這樣的方式:
In [10]: x, *y = p
In [11]: y
Out[11]: [2, 3]
複製程式碼
通過這種星號的方式,就可以解壓不確定個數或任意個數的可迭代物件了,是不是很棒呢?
那麼,用這個方法可以解決哪些問題呢?
先來看一種情況,現在有一個序列,去掉第一個數和最後一個數,然後求剩下數的平均值。
這個問題很簡單,我的第一反應是迴圈求和,然後計算平均值,顯然很麻煩。這時候星號表示式就派上用場了:
def drop_first_last(items):
first, *middle, last = items
return avg(middle)
複製程式碼
再看一種情況,比如字串的分割:
In [12]: line = 'drwxr-xr-x 41 zyx staff 1.4K 11 24 08:53 zyx'
In [13]: info, *fields, homedir = line.split(' ')
In [14]: info
Out[14]: 'drwxr-xr-x'
In [15]: homedir
Out[15]: 'zyx'
複製程式碼
2、保留最後 N 個元素
這個問題也是經常會遇到的,比如只取檔案中滿足要求的前五行,或者只返回滿足要求的最新十條資料。我的第一反應是列表,然後通過 push 和 pop 來操作列表來實現。
其實通過 collections.deque 可以很容易解決這個問題,使用 deque(maxlen=N) 建構函式新建一個固定大小的佇列。當新元素加入並且這個佇列已滿時,最先進入佇列的元素便會被移除,符合先進先出的原則。
In [16]: from collections import deque
In [17]: q = deque(maxlen=3)
In [18]: q.append(1)
In [19]: q.append(2)
In [20]: q.append(3)
In [21]: q
Out[21]: deque([1, 2, 3])
In [22]: q.append(4)
In [23]: q
Out[23]: deque([2, 3, 4])
複製程式碼
如果沒有設定 maxlen 則是一個無限大小的佇列,可以通過 appendleft 和 pop 在隊首和隊尾新增刪除元素。
3、字典中的鍵對映多個值
現在有一個需求,構建一個字典,key 是使用者 ID,value 為一個列表,列表元素可以是名字,電話等等,大概是這樣:
d = {'id': ['name', 'phone']}
複製程式碼
如果我們自己構建這個字典,可能會像下面這樣來實現:
d = {}
for key, value in items:
if key not in d:
d[key] = value
d[key].append(value)
複製程式碼
很麻煩,如果使用 collections 的 defaultdict 就很簡單了。defaultdict 的一個特徵就是它會自動初始化每個 key 剛開始對應的值,所以我們只關注新增元素操作就可以了。
優化後程式碼就變成了這樣:
d = defaultdict(list)
for key, value in items:
d[key].append(value)
複製程式碼
4、字典排序
字典是無序的,但如果要控制字典中元素的順序呢?可以使用 colletions 中的 OrderedDict,如下:
d = OrderedDict()
d['foo'] = 1
d['bar'] = 2
d['spam'] = 3
d['grok'] = 4
# Outputs "foo 1", "bar 2", "spam 3", "grok 4"
for key in d:
print(key, d[key])
複製程式碼
OrderedDict 內部維護這一個根據鍵插入順序排序的雙向連結串列。每次新元素插入時,便會被放在連結串列尾部,對於已經存在的鍵,並不會改變鍵的順序。
但需要注意的是,OrderedDict 的大小是普通字典的兩倍,所以在構建一個需要大量 OrderedDict 例項的資料結構時,就要考慮大量記憶體消耗的影響了。
5、字典的運算
如何取出字典中的最小值,或者對字典進行排序呢?
首先我們來看看直接使用普通的數學運算函式
In [25]: d = {'a': 11, 'b': 43, 'c': 3, 'd': 65}
In [26]: min(d)
Out[26]: 'a'
複製程式碼
它比較的邏輯是直接比較 key,然後取出對應的 key,但如果要比較 value 呢?
In [28]: min(d.values())
Out[28]: 3
複製程式碼
結果是正確的,但似乎並不完美,如果鍵值一起返回就完美了。這時候就該 zip 登場了,它的作用是可以使鍵和值反轉過來。
In [29]: min(zip(d.values(), d.keys()))
Out[29]: (3, 'c')
複製程式碼
它直接返回了值最小的鍵和值,這樣就很好了,不管需要哪個資訊都可以直接使用。如果要對這個字典排序的話也很簡單:
In [34]: sorted(zip(d.values(), d.keys()))
Out[34]: [(3, 'c'), (11, 'a'), (43, 'b'), (65, 'd')]
複製程式碼
先寫這麼多吧,未完待續。。。