我們在使用 sorted() 或 map() 函式的時候,都會看到裡面有一個 key 引數
其實這個 key 引數也存在於其他內建函式中(例如 min()、max() 等),那麼我們今天就來了解一下 key 引數的含義以及用途吧!
sorted() 中的 key
我們來看下面這段程式碼:
some_numbers = [
3.14159,
2.71828,
6.022e23,
6.626e-34,
299_792_458,
6.674e-11,
1.61803,
]
reordered_numbers = sorted(some_numbers)
print(*reordered_numbers, sep="\n")
reordered_numbers = sorted(some_numbers)
這一行程式碼使用 Python 的內建函式 sorted() 對 some_numbers 列表中的數值進行排序
*reordered_numbers
將列表中的元素作為引數傳遞給 print() 函式,其中解包運算子 *
逐個解包列表中的元素,這相當於在括號內直接用逗號分隔每個元素
輸出如下:
6.626e-34
6.674e-11
1.61803
2.71828
3.14159
299792458
6.022e+23
如果我們把要排序的元素由【數字】改成【名字(字串)】,看下會發生什麼
some_names = [
"Robert",
"Ishaan",
"Max",
"Trevor",
"Alexandra",
"Albert",
"Christine",
]
reordered_names = sorted(some_names)
print(*reordered_names, sep="\n")
輸出如下:
Albert
Alexandra
Christine
Ishaan
Max
Robert
Trevor
可以看到是按照名字的字母順序進行排序,那如果我們想要根據名稱的長度來進行排序呢?
也就是說,我想自己定義排序的規則,這便是 key 引數的使用場景了
我們可以把自定義的規則用函式的形式表示出來,然後再把函式名作為 key 引數的值
some_names = [
"Robert",
"Ishaan",
"Max",
"Trevor",
"Alexandra",
"Albert",
"Christine",
]
reordered_names = sorted(some_names, key=len)
print(*reordered_names, sep="\n")
首先列表中 some_names
的每個元素都作為引數傳遞給函式 len() ,然後 sorted() 使用 len() 返回的值來確定元素的順序
輸出如下:
Max
Robert
Ishaan
Trevor
Albert
Alexandra
Christine
上面我們說過可以把自定義的規則用函式的形式表示出來,然後再把函式名作為 key 引數的值
這裡的函式可以是:
- 內建函式
- 自定義函式
- 匿名函式(lambda)
下面是一個自定義函式的例子
some_names = [
"Robert",
"Ishaan",
"Max",
"Trevor",
"Alexandra",
"Albert",
"Christine",
]
def get_number_of_a_s(item):
return item.lower().count("a")
reordered_names = sorted(some_names, key=get_number_of_a_s)
print(*reordered_names, sep="\n")
函式 get_number_of_a_s()
將輸入字串轉換為小寫,並計算字母 “a” 的出現次數。該函式返回此計數,用於 sorted() 確定新列表中元素的順序。輸出如下:
Robert
Trevor
Christine
Max
Albert
Ishaan
Alexandra
由於 sorted() 透過按升序對數值進行排序來處理數值,因此沒有“a”的名稱首先出現,因為 .count("a") 這些名稱的返回 0
"Max" 並且是 "Albert" 下一個,因為它們包含一個出現的 “a”。 "Max" 列在最前面,因為它在原始列表中出現之前 "Albert" 。接下來是出現兩次和三次 “a” 的名稱
下面是一個 lambda 函式的例子
some_names = [
"Robert",
"Ishaan",
"Max",
"Trevor",
"Alexandra",
"Albert",
"Christine",
]
reordered_names = sorted(
some_names,
key=lambda item: item.lower().count("a"),
)
print(*reordered_names, sep="\n")
list.sort() 中的 key
sorted()
- 返回一個新的排序列表
- 不會修改原始列表
- 可以給定一個自定義的比較函式
list.sort()
- 對列表進行原地排序
- 會修改原始列表
- 不能給定一個自定義的比較函式
我們來看看列表的排序函式 list.sort(),需要注意的是:list.sort() 不像內建函式 sorted() 那樣返回一個新的排序列表,而是對原有列表進行排序
some_names = [
"Robert",
"Ishaan",
"Max",
"Trevor",
"Alexandra",
"Albert",
"Christine",
]
some_names.sort(
key=lambda item: item.lower().count("a")
)
print(*some_names, sep="\n")
輸出如下:
Robert
Trevor
Christine
Max
Albert
Ishaan
Alexandra
max() 和 min() 中的 key
不單單 sorted() 和 list.sort() 函式有 key 引數,max()\min() 裡面也有
比如說我想返回一個隨機列表中的最大值,並自定義了比較規則
import random
numbers = [random.randint(1, 50) for _ in range(20)]
print(numbers)
# 輸出出列表 numbers 中的最大值
print(
max(numbers)
)
print(
max(
numbers,
key=lambda x: sum(int(y) for y in str(x)),
)
)
輸出如下:
[6, 8, 44, 16, 46, 43, 23, 26, 33, 28, 32, 26, 15, 38, 32, 38, 23, 13, 21, 26]
46
38
其中 key 引數的值為 lambda 函式,使用 lambda 函式來自定義規則,計算列表中每個元素的各位數之和,並找出其中的最大值:
- str(x) 將整數轉換為字串,int(y) 將字串轉換為整數,然後 sum() 函式計算了該數字的各位數之和。
- max() 函式根據這個規則找到了列表中數字各位數之和最大的那個數字
其他
除此之外,像 heapq 模組中的nlargest() 和 nsmallest() 函式、itertools 模組中的groupby() 函式也有 key 引數
我們來看個例子,使用 itertools.groupby() 函式,將名字列表 some_names 按照名字長度進行分組,並將分組結果列印輸出
#學習中遇到問題沒人解答?小編建立了一個Python學習交流群:531509025
import itertools
some_names = [
"Robert",
"Ishaan",
"Max",
"Trevor",
"Alexandra",
"Albert",
"Christine",
]
output = itertools.groupby(
some_names,
key=len,
)
for item, group in output:
print(item, list(group))
函式 itertools.groupby() 有兩個引數(第二個引數是可選的)。第一個引數是包含資料的可迭代物件,第二個引數是 key
key=len 表示按照元素的長度進行分組。groupby() 函式將根據指定的 key 返回一個迭代器,該迭代器產生一對元素,第一個元素是分組的鍵(這裡是名字的長度),第二個元素是對應的分組中的元素。
輸出如下:
6 ['Robert', 'Ishaan']
3 ['Max']
6 ['Trevor']
9 ['Alexandra']
6 ['Albert']
9 ['Christine']