Python3 CookBook | 資料結構和演算法（一）

yongxinz發表於2017-11-29

Python資料結構演算法

歡迎關注我的微信公眾號 AlwaysBeta，更多精彩內容等你來。

以下測試程式碼全部基於 Python3。

Python 提供了大量的內建資料結構，包括列表，集合以及字典。在工作和編碼中，可以說天天和它們打交道，經常碰到查詢，排序和過濾等等這些問題，雖然每次解決這些問題並不困難，但總感覺程式碼寫的很麻煩，不夠優雅。

最近通過閱讀《Python3 CookBook》，瞭解了一些更優秀的方法，做一些簡單記錄，與大家分享。

1、解壓可迭代物件賦值給多個變數

我們都知道，一個序列是可以賦值給多個變數的，就像下面這樣：

In [7]: p = (1, 2, 3)

In [8]: x, y, z = p

In [9]: x
Out[9]: 1
複製程式碼

但如果接收的變數個數和序列元素個數不一致，就會報錯，如果你不知道元素個數的話，可以採用下面這樣的方式：

In [10]: x, *y = p

In [11]: y
Out[11]: [2, 3]
複製程式碼

通過這種星號的方式，就可以解壓不確定個數或任意個數的可迭代物件了，是不是很棒呢？

那麼，用這個方法可以解決哪些問題呢？

先來看一種情況，現在有一個序列，去掉第一個數和最後一個數，然後求剩下數的平均值。

這個問題很簡單，我的第一反應是迴圈求和，然後計算平均值，顯然很麻煩。這時候星號表示式就派上用場了：

def drop_first_last(items):
  first, *middle, last = items
  return avg(middle)
複製程式碼

再看一種情況，比如字串的分割：

In [12]: line = 'drwxr-xr-x  41 zyx  staff   1.4K 11 24 08:53 zyx'

In [13]: info, *fields, homedir = line.split(' ')

In [14]: info
Out[14]: 'drwxr-xr-x'

In [15]: homedir
Out[15]: 'zyx'
複製程式碼

2、保留最後 N 個元素

這個問題也是經常會遇到的，比如只取檔案中滿足要求的前五行，或者只返回滿足要求的最新十條資料。我的第一反應是列表，然後通過 push 和 pop 來操作列表來實現。

其實通過 collections.deque 可以很容易解決這個問題，使用 deque(maxlen=N) 建構函式新建一個固定大小的佇列。當新元素加入並且這個佇列已滿時，最先進入佇列的元素便會被移除，符合先進先出的原則。

In [16]: from collections import deque

In [17]: q = deque(maxlen=3)

In [18]: q.append(1)

In [19]: q.append(2)

In [20]: q.append(3)

In [21]: q
Out[21]: deque([1, 2, 3])

In [22]: q.append(4)

In [23]: q
Out[23]: deque([2, 3, 4])
複製程式碼

如果沒有設定 maxlen 則是一個無限大小的佇列，可以通過 appendleft 和 pop 在隊首和隊尾新增刪除元素。

3、字典中的鍵對映多個值

現在有一個需求，構建一個字典，key 是使用者 ID，value 為一個列表，列表元素可以是名字，電話等等，大概是這樣：

d = {'id': ['name', 'phone']}
複製程式碼

如果我們自己構建這個字典，可能會像下面這樣來實現：

d = {}
for key, value in items:
  if key not in d:
    d[key] = value
  d[key].append(value)
複製程式碼

很麻煩，如果使用 collections 的 defaultdict 就很簡單了。defaultdict 的一個特徵就是它會自動初始化每個 key 剛開始對應的值，所以我們只關注新增元素操作就可以了。

優化後程式碼就變成了這樣：

d = defaultdict(list)
for key, value in items:
  d[key].append(value)
複製程式碼

4、字典排序

字典是無序的，但如果要控制字典中元素的順序呢？可以使用 colletions 中的 OrderedDict，如下：

d = OrderedDict()
d['foo'] = 1
d['bar'] = 2
d['spam'] = 3
d['grok'] = 4
# Outputs "foo 1", "bar 2", "spam 3", "grok 4"

for key in d:
  print(key, d[key])
複製程式碼

OrderedDict 內部維護這一個根據鍵插入順序排序的雙向連結串列。每次新元素插入時，便會被放在連結串列尾部，對於已經存在的鍵，並不會改變鍵的順序。

但需要注意的是，OrderedDict 的大小是普通字典的兩倍，所以在構建一個需要大量 OrderedDict 例項的資料結構時，就要考慮大量記憶體消耗的影響了。

5、字典的運算

如何取出字典中的最小值，或者對字典進行排序呢？

首先我們來看看直接使用普通的數學運算函式

In [25]: d = {'a': 11, 'b': 43, 'c': 3, 'd': 65}

In [26]: min(d)
Out[26]: 'a'
複製程式碼

它比較的邏輯是直接比較 key，然後取出對應的 key，但如果要比較 value 呢？

In [28]: min(d.values())
Out[28]: 3
複製程式碼

結果是正確的，但似乎並不完美，如果鍵值一起返回就完美了。這時候就該 zip 登場了，它的作用是可以使鍵和值反轉過來。

In [29]: min(zip(d.values(), d.keys()))
Out[29]: (3, 'c')
複製程式碼

它直接返回了值最小的鍵和值，這樣就很好了，不管需要哪個資訊都可以直接使用。如果要對這個字典排序的話也很簡單：

In [34]: sorted(zip(d.values(), d.keys()))
Out[34]: [(3, 'c'), (11, 'a'), (43, 'b'), (65, 'd')]
複製程式碼

先寫這麼多吧，未完待續。。。

Java資料結構和演算法（一）連結串列
2020-10-16
Java資料結構演算法
資料結構和演算法
2020-12-25
資料結構演算法
資料結構和演算法-堆
2020-06-15
資料結構演算法
JavaScript資料結構和演算法
2018-12-24
JavaScript資料結構演算法
聊聊資料結構和演算法
2021-01-21
資料結構演算法
python演算法與資料結構-演算法和資料結構介紹(31)
2019-06-21
Python演算法資料結構
資料結構和演算法總結--棧
2020-10-07
資料結構演算法
資料結構和演算法-學習筆記（一）
2018-10-19
資料結構演算法筆記
第一章：資料結構和演算法
2018-09-06
資料結構演算法
資料結構和演算法之-列表
2019-02-16
資料結構演算法
Java的資料結構和演算法
2019-04-03
Java資料結構演算法
JavaScript 的資料結構和演算法
2019-12-02
JavaScript資料結構演算法
資料結構和演算法：遞迴
2020-08-26
資料結構演算法遞迴
資料結構和演算法（一）線性表實現
2020-04-06
資料結構演算法
資料結構與演算法-資料結構（棧）
2018-12-12
資料結構演算法
資料結構與演算法----# 一、排序
2022-03-16
資料結構演算法排序
資料結構和演算法之——跳錶
2018-10-29
資料結構演算法
演算法和資料結構-簡版1
2019-01-26
演算法資料結構
CHC5223資料結構和演算法
2024-04-04
資料結構演算法
快速入門資料結構和演算法
2020-08-12
資料結構演算法
資料結構和演算法（六）佇列
2021-09-09
資料結構演算法佇列
leetcode演算法資料結構題解---資料結構
2021-03-03
LeetCode演算法資料結構
資料結構：初識（資料結構、演算法與演算法分析）
2020-07-21
資料結構演算法
js資料結構和演算法(9)-排序演算法
2019-04-22
JS資料結構演算法排序
【PHP資料結構】PHP資料結構及演算法總結
2021-09-09
PHP資料結構演算法
開心檔之Python3 資料結構
2023-02-24
Python資料結構
資料結構&演算法
2020-06-05
資料結構演算法
Java資料結構與排序演算法（一）
2018-07-10
Java資料結構排序演算法
資料結構基礎和演算法題系列總結
2018-10-03
資料結構演算法
JavaScript 的資料結構和演算法 - 連結串列篇
2019-12-15
JavaScript資料結構演算法
JavaScript 的資料結構和演算法 - 前言篇
2019-12-12
JavaScript資料結構演算法
資料結構和演算法-切片實現棧
2020-06-15
資料結構演算法
JavaScript 的資料結構和演算法 - 棧篇
2020-01-05
JavaScript資料結構演算法
資料結構和演算法：二叉樹
2020-10-03
資料結構演算法二叉樹
資料結構和演算法-雜湊表 (HashTable)
2020-06-13
資料結構演算法
為什麼演算法和資料結構重要？
2024-05-29
演算法資料結構
每週一練之資料結構與演算法（Dictionary 和 HashTable）
2019-05-20
資料結構演算法
結構化資料、半結構化資料和非結構化資料
2018-06-21
資料結構和演算法——棧的面試演算法
2020-08-29
資料結構演算法面試