上個月,學習群裡的 S 同學問了個題目,大意可理解為列表降維
,例子如下:
oldlist = [[1, 2, 3], [4, 5]]
# 想得到結果:
newlist = [1, 2, 3, 4, 5]
複製程式碼
原始資料是一個二維列表,目的是獲取該列表中所有元素的具體值。從抽象一點的角度來理解,也可看作是列表解壓或者列表降維。
這個問題並不難,但是,怎麼寫才比較優雅呢?
# 方法一,粗暴拼接法:
newlist = oldlist[0] + oldlist[1]
複製程式碼
這種方法簡單粗暴,需要拼接什麼內容,就取出來直接拼接。然而,如果原列表有很多子列表,則這個方法就會變得繁瑣了。
我們把原問題升級一下:一個二維列表包含 n 個一維列表元素,如何優雅地把這些子列表拼成一個新的一維列表?
方法一的做法需要寫 n 個物件,以及 n - 1 次拼接操作。當然不可行。下面看看方法二:
# 方法二,列表推導式:
newlist = [i for j in range(len(oldlist)) for i in oldlist[j]]
複製程式碼
這個表示式中出現了兩個 for 語句,在第一個 for 語句中,我們先取出原列表的長度,然後構造 range 物件,此時 j 的取值範圍是 [0, n-1] 的閉區間。
在第二個 for 語句中,oldlist[j] 指的正是原列表的第 j 個子列表,for i in oldlist[j]
則會遍歷取出 j 子列表的元素,由於 j 取值的區間正對應於原列表的全部索引值,所以,最終達到解題目的。
這種方法足夠優雅了,而且理解也並不難。
然而,我們是否就能滿足於此了呢?有沒有其它奇技淫巧,哦不,是其它高階方法呢?F 同學貢獻了一個思路:
# 方法三,巧用sum:
newlist = sum(oldlist,[])
複製程式碼
說實話,這個方法令我大感意外!sum() 函式不是用於求和的麼?怎麼竟然有此用法?
這個寫法利用了什麼原理呢?由於我開始時不知道 sum() 函式可以接收兩個引數,不清楚它們是怎麼用於計算的,所以一度很困惑。但是,當我知道 sum() 的完整用法時,我恍然大悟。
接下來也不賣關子了,直接揭曉吧。
語法: sum(iterable[, start])
,sum() 函式的第一個引數是可迭代物件,如列表、元組或集合等,第二個引數是起始值,預設為 0 。其用途是以 start 值為基礎,再與可迭代物件的所有元素相“加”。
在上例中,執行效果是 oldlist 中的子列表逐一與第二個引數相加,而列表的加法相當於 extend 操作,所以最終結果是由 [] 擴充成的列表。
這裡有兩個關鍵點:sum() 函式允許帶兩個引數,且第二個引數才是起點。 可能 sum() 函式用於數值求和比較多,然而用於作列表的求和,就有奇效。它比列表推導式更加優雅簡潔!
至此,前面的升級版問題就得到了很好的回答。簡單回顧一下,s 同學最初的問題可以用三種方法實現,第一種方法中規中矩,第二種方法正道進階,而第三種方法旁門左道(沒有貶義,只是說它出人意料,卻效果奇佳)。
這道並不算難的問題,在眾人的討論與分享後,竟還引出了很有價值的學習內容。前不久,同樣是群內的一個問題,也產生了同樣的學習效果,詳見《Python進階:如何將字串常量轉為變數?》。
我從中得到了一個啟示:應該多角度地思考問題,設法尋求更優解,同時,基礎知識應掌握牢固,並靈活貫通起來。
學無止境,這裡我還想再開拓一下思路,看看能發現些什麼。
1、如果原列表的元素除了列表,還有其它型別的元素,怎麼把同類的元素歸併在一起呢?
2、如果是一個三維或更高維的列表,怎麼更好地把它們壓縮成一維列表呢?
3、sum() 函式還有什麼知識要點呢?
前兩個問題增加了複雜度,解決起來似乎沒有“靈丹妙藥”了,只能用笨方法分別拆解,逐一解壓。
第三個思考題是關於 sum() 函式本身的用法,我們看看官方文件是怎麼說的:
The iterable’s items are normally numbers, and the start value is not allowed to be a string.
For some use cases, there are good alternatives to
sum()
. The preferred, fast way to concatenate a sequence of strings is by calling''.join(sequence)
. To add floating point values with extended precision, seemath.fsum()
. To concatenate a series of iterables, consider usingitertools.chain()
.
sum() 的第二個引數不允許是字串。如果用了,會報錯:
TypeError: sum() can't sum strings [use ''.join(seq) instead]
為什麼不建議使用 sum() 來拼接字串呢?哈哈,文件中建議使用 join() 方法,因為它更快。為了不給我們使用慢的方法,它竟特別限定不允許 sum() 的第二個引數是字串。
文件還建議,在某些使用場景時,不要用 sum() ,例如當以擴充套件精度對浮點數求和時,推薦使用 math.fsum()
;當要拼接一系列的可迭代物件時,應考慮使用 itertools.chain()
。
浮點數的計算是個難題,我曾轉載過一篇《如何在 Python 裡面精確四捨五入?》,對此有精彩分析。而itertools.chain()
可以將不同型別的可迭代物件串聯成一個更大的迭代器,這在舊文《Python進階:設計模式之迭代器模式》中也有論及。
不經意間,sum() 函式的注意事項,竟把 Python 其它的進階內容都聯絡起來了。小小的函式,竟成為學習之路上的一個樞紐。
前段時間,我還寫過 range() 、locals() 和 eval() 等內建函式,也是通過一個問題點,而關聯出多個知識點, 獲益良多。這些內建函式/類的魔力可真不小啊。
本文到此結束,希望對你有所幫助。
友情提示: 本公眾號內有限時抽獎活動,送出 Python 書籍 15 本,書目有《Python資料分析與挖掘實戰》、《Python語言程式設計》《自學Python程式設計基礎、科學計算及資料分析》《實用機器學習》、《Python程式設計師面試演算法寶典》,活動結束時間為本月 20 日 18 點 ,趕快來抽獎啦!詳情請戳:抽獎送書
公眾號【Python貓】, 專注Python技術、資料科學和深度學習,力圖創造一個有趣又有用的學習分享平臺。本號連載優質的系列文章,有喵星哲學貓系列、Python進階系列、好書推薦系列、優質英文推薦與翻譯等等,歡迎關注哦。PS:後臺回覆“愛學習”,免費獲得一份學習大禮包。