Python 中 key 引數的含義及用法

鹹魚Linux運維發表於2023-12-25

哈嘍大家好,我是鹹魚

我們在使用 sorted()map() 函式的時候,都會看到裡面有一個 key 引數

其實這個 key 引數也存在於其他內建函式中(例如 min()max() 等),那麼我們今天就來了解一下 key 引數的含義以及用途吧!

原文:https://www.thepythoncodingstack.com/p/the-key-to-the-key-parameter-in-python

sorted() 中的 key

我們來看下面這段程式碼:

some_numbers = [
    3.14159,
    2.71828,
    6.022e23,
    6.626e-34,
    299_792_458,
    6.674e-11,
    1.61803,
]

reordered_numbers = sorted(some_numbers)

print(*reordered_numbers, sep="\n")

reordered_numbers = sorted(some_numbers) 這一行程式碼使用 Python 的內建函式 sorted()some_numbers 列表中的數值進行排序

*reordered_numbers 將列表中的元素作為引數傳遞給 print() 函式,其中解包運算子 * 逐個解包列表中的元素,這相當於在括號內直接用逗號分隔每個元素

輸出如下:

6.626e-34
6.674e-11
1.61803
2.71828
3.14159
299792458
6.022e+23

如果我們把要排序的元素由【數字】改成【名字(字串)】,看下會發生什麼

some_names = [
    "Robert",
    "Ishaan",
    "Max",
    "Trevor",
    "Alexandra",
    "Albert",
    "Christine",
]

reordered_names = sorted(some_names)
print(*reordered_names, sep="\n")

輸出如下:

Albert
Alexandra
Christine
Ishaan
Max
Robert
Trevor

可以看到是按照名字的字母順序進行排序,那如果我們想要根據名稱的長度來進行排序呢?

也就是說,我想自己定義排序的規則,這便是 key 引數的使用場景了

我們可以把自定義的規則用函式的形式表示出來,然後再把函式名作為 key 引數的值

some_names = [
    "Robert",
    "Ishaan",
    "Max",
    "Trevor",
    "Alexandra",
    "Albert",
    "Christine",
]

reordered_names = sorted(some_names, key=len)
print(*reordered_names, sep="\n")

首先列表中 some_names 的每個元素都作為引數傳遞給函式 len() ,然後 sorted() 使用 len() 返回的值來確定元素的順序

輸出如下:

Max
Robert
Ishaan
Trevor
Albert
Alexandra
Christine

上面我們說過可以把自定義的規則用函式的形式表示出來,然後再把函式名作為 key 引數的值

這裡的函式可以是:

  • 內建函式
  • 自定義函式
  • 匿名函式(lambda)

下面是一個自定義函式的例子

some_names = [
    "Robert",
    "Ishaan",
    "Max",
    "Trevor",
    "Alexandra",
    "Albert",
    "Christine",
]

def get_number_of_a_s(item):
    return item.lower().count("a")

reordered_names = sorted(some_names, key=get_number_of_a_s)
print(*reordered_names, sep="\n")

函式 get_number_of_a_s() 將輸入字串轉換為小寫,並計算字母 “a” 的出現次數。該函式返回此計數,用於 sorted() 確定新列表中元素的順序。輸出如下:

Robert
Trevor
Christine
Max
Albert
Ishaan
Alexandra

由於 sorted() 透過按升序對數值進行排序來處理數值,因此沒有“a”的名稱首先出現,因為 .count("a") 這些名稱的返回 0

"Max" 並且是 "Albert" 下一個,因為它們包含一個出現的 “a”。 "Max" 列在最前面,因為它在原始列表中出現之前 "Albert" 。接下來是出現兩次和三次 “a” 的名稱

下面是一個 lambda 函式的例子

some_names = [
    "Robert",
    "Ishaan",
    "Max",
    "Trevor",
    "Alexandra",
    "Albert",
    "Christine",
]

reordered_names = sorted(
    some_names,
    key=lambda item: item.lower().count("a"),
)
print(*reordered_names, sep="\n")

list.sort() 中的 key

sorted()

  • 返回一個新的排序列表
  • 不會修改原始列表
  • 可以給定一個自定義的比較函式

list.sort()

  • 對列表進行原地排序
  • 會修改原始列表
  • 不能給定一個自定義的比較函式

我們來看看列表的排序函式 list.sort(),需要注意的是:list.sort() 不像內建函式 sorted() 那樣返回一個新的排序列表,而是對原有列表進行排序

some_names = [
    "Robert",
    "Ishaan",
    "Max",
    "Trevor",
    "Alexandra",
    "Albert",
    "Christine",
]

some_names.sort(
    key=lambda item: item.lower().count("a")
)
print(*some_names, sep="\n")

輸出如下:

Robert
Trevor
Christine
Max
Albert
Ishaan
Alexandra

max() 和 min() 中的 key

不單單 sorted()list.sort() 函式有 key 引數,max()\min() 裡面也有

比如說我想返回一個隨機列表中的最大值,並自定義了比較規則

import random

numbers = [random.randint(1, 50) for _ in range(20)]

print(numbers)

# 輸出出列表 numbers 中的最大值
print(
    max(numbers)
)

print(
    max(
        numbers,
        key=lambda x: sum(int(y) for y in str(x)),
    )
)

輸出如下:

[6, 8, 44, 16, 46, 43, 23, 26, 33, 28, 32, 26, 15, 38, 32, 38, 23, 13, 21, 26]
46
38

其中 key 引數的值為 lambda 函式,使用 lambda 函式來自定義規則,計算列表中每個元素的各位數之和,並找出其中的最大值:

  • str(x) 將整數轉換為字串,int(y) 將字串轉換為整數,然後 sum() 函式計算了該數字的各位數之和。
  • max() 函式根據這個規則找到了列表中數字各位數之和最大的那個數字

其他

除此之外,像 heapq 模組中的nlargest()nsmallest() 函式、itertools 模組中的groupby() 函式也有 key 引數

我們來看個例子,使用 itertools.groupby() 函式,將名字列表 some_names 按照名字長度進行分組,並將分組結果列印輸出

import itertools

some_names = [
    "Robert",
    "Ishaan",
    "Max",
    "Trevor",
    "Alexandra",
    "Albert",
    "Christine",
]

output = itertools.groupby(
    some_names,
    key=len,
)
for item, group in output:
    print(item, list(group))

函式 itertools.groupby() 有兩個引數(第二個引數是可選的)。第一個引數是包含資料的可迭代物件,第二個引數是 key

key=len 表示按照元素的長度進行分組。groupby() 函式將根據指定的 key 返回一個迭代器,該迭代器產生一對元素,第一個元素是分組的鍵(這裡是名字的長度),第二個元素是對應的分組中的元素。

輸出如下:

6 ['Robert', 'Ishaan']
3 ['Max']
6 ['Trevor']
9 ['Alexandra']
6 ['Albert']
9 ['Christine']

相關文章