替代 for 迴圈,讓 Python 程式碼更 pythonic !

大话性能發表於2024-03-04

為什麼要挑戰不在程式碼中使用 for 迴圈呢?因為這樣可以促使你學習使用更高階、更地道的語法或庫。以 Python 為例,本文介紹了許多大家其實在別人的程式碼裡都見過、但自己很少用的語法。
從我開始探索 Python 中驚人的語言功能到現在已經有一段時間了。一開始,我給自己提出了一個挑戰:練習更多的 Python 語法,降低使用 for 迴圈的頻率。這讓我的程式碼變得更簡潔和規範,看起來更 pythonic!下面我將會介紹這樣做的好處。

通常如下使用場景中會用到 for 迴圈:

  • 在一個序列來提取一些資訊。

  • 從一個序列生成另一個序列。

  • 寫 for 已成習慣。

幸運的是,Python 已經有很多工具可以幫助你完成這些工作,你只需要轉移你的思路,並以不同的角度來思考它。

透過避免編寫 for 迴圈,你可以獲得什麼好處:

  • 較少的程式碼量
  • 更好的程式碼可讀性
  • 更少的縮排(對 Python 還是很有意義的)

我們來看一下下面的程式碼結構:

# 1
with ...:
    for ...:
        if ...:
            try:
            except:
        else:

在這個例子中,我們正在處理多層巢狀的程式碼,這很難閱讀。這個例子使用了多層巢狀的程式碼。我在這段程式碼中發現它無差別使用縮排把管理邏輯(with, try-except)和業務邏輯(for, if)混在一起。如果你遵守只對管理邏輯使用縮排的規範,那麼核心業務邏輯應該立刻脫離出來。

"扁平結構比巢狀結構更好" - The Zen of Python

可以使用的已有的工具來替換 for 迴圈

1.List Comprehension / Generator 表示式

我們來看一個簡單的例子。如果你想將一個陣列轉換為另一個陣列:

result = []
for item in item_list:
    new_item = do_something_with(item)
    result.append(item)

如果你喜歡 MapReduce,你也可以使用 map,或者 Python 中的 List Comprehension:

result = [do_something_with(item) for item in item_list]

同樣,如果您只想迭代陣列中的元素,也可以使用一樣的程式碼 Generator Expression。result = (do_something_with(item) for item in item_list)

2.函式

如果您想要將一個陣列對映成另外陣列,只需呼叫 map 函式,就可以用一個更高階、更實用的程式設計方式解決這個問題。

doubled_list = map(lambda x: x * 2, old_list)

如果要將序列減少為單個,請使用 reduce

from functools import reduce
summation = reduce(lambda x, y: x + y, numbers)

另外,許多 Python 內建函式都會使用 iterables:

>>> a = list(range(10))
>>> a
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> all(a)
False
>>> any(a)
True
>>> max(a)
9
>>> min(a)
0
>>> list(filter(bool, a))
[1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> set(a)
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
>>> dict(zip(a,a))
{0: 0, 1: 1, 2: 2, 3: 3, 4: 4, 5: 5, 6: 6, 7: 7, 8: 8, 9: 9}
>>> sorted(a, reverse=True)
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
>>> str(a)
'[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]'
>>> sum(a)
45

3.Extract Functions or Generators

上述兩種方法是很好的處理更簡單的邏輯。更復雜的邏輯怎麼樣?作為程式設計師,我們編寫函式來抽離出複雜的業務。相同的想法適用於此。如果你是這樣寫的:

results = []
for item in item_list:
    # setups
    # condition
    # processing
    # calculation
    results.append(result)

顯然,你讓一個程式碼塊承擔了太多的功能。相反,我建議你做:

def process_item(item):
    # setups
    # condition
    # processing
    # calculation
    return result

results = [process_item(item) for item in item_list]

如果換成巢狀函式會如何

results = []
for i in range(10):
    for j in range(i):
        results.append((i, j))

換成 List Comprehension 來實現是這樣的

results = [(i, j)
           for i in range(10)
           for j in range(i)]

如果你的程式碼塊需要記錄一些內部狀態

# finding the max prior to the current item
a = [3, 4, 6, 2, 1, 9, 0, 7, 5, 8]
results = []
current_max = 0
for i in a:
    current_max = max(i, current_max)
    results.append(current_max)

# results = [3, 4, 6, 6, 6, 9, 9, 9, 9, 9]

我們使用 generator 來實現這一點

def max_generator(numbers):
    current_max = 0
    for i in numbers:
        current_max = max(i, current_max)
        yield current_max

a = [3, 4, 6, 2, 1, 9, 0, 7, 5, 8]
results = list(max_generator(a))

讀者可能要問 “等等!你在 generator 中用到 for 迴圈,作弊啊!別急,再看看下面的程式碼。

不需要自己寫,itertools 已經幫你實現了

這個模組很簡單,我相信這個模組在大多數場景中可以替換你原先的 for 迴圈。

例如,最後一個例子可以重寫為:

from itertools import accumulate
a = [3, 4, 6, 2, 1, 9, 0, 7, 5, 8]
resutls = list(accumulate(a, max))

另外,如果要迭代組合序列,則需要使用 product(), permutations(), combinations()。

結論

在大多數情況下,都不需要寫 for 迴圈。

應該儘量避免寫 for 迴圈,這樣會有更好的程式碼可讀性。
更多內容可以學習《測試工程師 Python 工具開發實戰》書籍《大話效能測試 JMeter 實戰》書籍

相關文章