列表生成式(list comprehension)是一種簡化程式碼的優美方法。根據python文件,“列表生成式提供了一種建立列表的簡潔方法。”在這篇教程裡,我將會使用一些例子來展示如果使用列表推導式。
Tools
1ea python
1 平方列表
如果你想建立一個包含1到10的平方的列表,你可以這樣做:
1 2 3 |
squares = [] for x in range(10): squares.append(x**2) |
這是一個簡單的例子,但是使用列表生成式可以更簡潔地建立這個列表。
1 |
squares = [x**2 for x in range(10)] |
這個最簡單的列表生成式由方括號開始,方括號內部先是一個表示式,其後跟著一個for語句。列表生成式總是返回一個列表。
2 整除3的數字列表
通常,你可能這樣寫:
1 2 3 4 |
numbers = [] for x in range(100): if x % 3 == 0: numbers.append(x) |
你可以在列表生成式裡包含一個if語句,來有條件地為列表新增項。為了建立一個包含0到100間能被3整除的數字列表,可以使用列表推導式:
1 |
numbers = [x for x in range(100) if x % 3 == 0] |
3 找出質數
這通常要使用好幾行程式碼來實現。
1 2 3 4 5 6 7 8 |
noprimes = [] for i in range(2, 8): for j in range(i*2, 50, i): noprimes.append(j) primes = [] for x in range(2, 50): if x not in noprimes: primes.append(x) |
不過,你可以使用兩個列表生成式來簡化程式碼。
1 2 |
noprimes = [j for i in range(2, 8) for j in range(i*2, 50, i)] primes = [x for x in range(2, 50) if x not in noprimes] |
第一行程式碼在一個列表生成式裡使用了多層for迴圈。第一個迴圈是外部迴圈,第二個迴圈是是內部迴圈。為了找到質數,我們首先找到一個非質數的列表。通過找出2-7的倍數來產生這個非質數列表。然後我們迴圈遍歷數字並檢視每個數字是否在非質數列表。
修正:正如reddit上的shoyer指出的,使用集合(set)來查詢noprimes(程式碼裡的屬性引數,譯者注)效率更高。由於noprimes應該只包含唯一的值,並且我們頻繁地去檢查一個值是否存在,所以我們應該使用集合。集合的使用語法和列表的使用語法類似,所以我們可以這樣使用:
1 2 |
noprimes = set(j for i in range(2, 8) for j in range(i*2, 50, i)) primes = [x for x in range(2, 50) if x not in noprimes] |
4 巢狀列表降維
假設你有一個列表的列表(列表裡包含列表)或者一個矩陣,
1 |
matrix = [[0,1,2,3], [4,5,6,7], [8,9,10,11]] |
並且你想把它降維到一個一維列表。你可以這樣做:
1 2 3 4 |
flattened = [] for row in matrix: for i in row: flattened.append(i) |
使用列表生成式:
1 |
flattened = [i for row in matrix for i in row] |
這使用了兩個for迴圈去迭代整個矩陣。外層(第一個)迴圈按行迭代,內部(第二個)迴圈對該行的每個項進行迭代。
5 模擬多個擲硬幣事件
假設需要模擬多次擲硬幣事件,其中0表示正面,1表示反面,你可以這樣編寫程式碼:
1 2 3 4 |
from random import random results = [] for x in range(10): results.append(int(round(random()))) |
或者使用列表生成式使程式碼更簡潔:
1 2 |
from random import random results = [int(round(random())) for x in range(10)] |
這裡使用了range函式迴圈了10次。每一次我們都把random()的輸出進行四捨五入。因為random()函式返回一個0到1的浮點數,所以對輸出進行四捨五入就會返回0或者1。Round()函式返回一個浮點型資料,使用int()將其轉為整型並新增到列表裡。
6 移除句子中的母音字母
假設你有一個句子,
1 |
sentence = 'Your mother was a hamster' |
並且你想移除所有的母音字母。我們可以使用幾行程式碼輕易做到:
1 2 3 4 5 6 |
vowels = 'aeiou' non_list = [] for l in sentence: if not l in vowels: non_list.append(l) nonvowels = ''.join(non_list) |
或者你可以使用列表生成式簡化它:
1 2 |
vowels = 'aeiou' nonvowels = ''.join([l for l in sentence if not l in vowels]) |
這個例子使用列表生成式建立一個字母列表,字母列表的字母來自sentence句子的非母音字母。然後我們把生成的列表傳給join()函式去轉換為字串。
修正:正如reddit上的iamadogwhatisthis提出的,這個例子不需要列表生成式。使用生成器(generator)更好:
1 2 |
vowels = 'aeiou' nonvowels = ''.join(l for l in sentence if not l in vowels) |
注意,這裡去掉了方括號。這是因為join函式接收任意可迭代的資料,包括列表或者生成器。這個沒有方括號的語法使用了生成器。這產生(與列表生成式)同樣的結果,相對於之前把所有條目包裝成一個列表,生成器在我們遍歷時才產生相應的條目。這可以使我們不必儲存整個列表到記憶體,並且這對於處理大量資料更有效率。
7 獲取目錄裡的檔名列表
下面的程式碼將會遍歷my_dir目錄下的檔案,並在files裡追加每個以txt為字尾的檔名。
1 2 3 4 5 |
import os files = [] for f in os.listdir('./my_dir'): if f.endswith('.txt'): files.append(f) |
這同樣可以使用列表生成式簡化程式碼:
1 2 |
import os files = [f for f in os.listdir('./my_dir') if f.endswith('.txt')] |
或者你可以獲取一個相對路徑的列表:
1 2 |
import os files = [os.path.join('./my_dir', f) for f in os.listdir('./my_dir') if f.endswith('.txt')] |
感謝reddit上的rasbt提供。
8 將csv檔案讀取為字典列表
我們常常需要讀取和處理csv檔案的資料。處理csv資料的一個最有用的方法就是把它轉換為一個字典列表。
1 2 3 4 |
import csv data = [] for x in csv.DictReader(open('file.csv', 'rU')): data.append(x) |
你可以使用列表生成式快速實現:
1 2 |
import csv data = [ x for x in csv.DictReader(open('file.csv', 'rU'))] |
DictReader類將會自動地使用csv檔案的第一行作為字典的key屬性名。DictReader類返回一個將會遍歷csv檔案所有行的物件。這個檔案物件通過open()函式產生。我們提供了open()兩個引數–第一個是csv檔名,第二個是模式。在這例子,‘rU’有兩個意思。想往常一樣,‘r’表示以讀模式開啟檔案。‘U’表明我們將會接受通用換行符–‘n’,‘r’和‘rn’。
感謝reddit上的blacwidonsfw提供。