如何給列表降維?sum() 函式的妙用

Python開發者發表於2019-04-23

(給Python開發者加星標,提升Python技能


作者:豌豆花下貓 (本文來自作者投稿)

列表降維大意可理解為 ,例子如下:

oldlist = [[123], [45]]

# 想得到結果:
newlist = [12345]

原始資料是一個二維列表,目的是獲取該列表中所有元素的具體值。從抽象一點的角度來理解,也可看作是列表解壓或者列表降維。

這個問題並不難,但是,怎麼寫才比較優雅呢?

# 方法一,粗暴拼接法:
newlist = oldlist[0] + oldlist[1]

這種方法簡單粗暴,需要拼接什麼內容,就取出來直接拼接。然而,如果原列表有很多子列表,則這個方法就會變得繁瑣了。

我們把原問題升級一下:一個二維列表包含 n 個一維列表元素,如何優雅地把這些子列表拼成一個新的一維列表?

方法一的做法需要寫 n 個物件,以及 n - 1 次拼接操作。當然不可行。下面看看方法二:

# 方法二,列表推導式:
newlist = [i for j in range(len(oldlist)) for i in oldlist[j]]

這個表示式中出現了兩個 for 語句,在第一個 for 語句中,我們先取出原列表的長度,然後構造 range 物件,此時 j 的取值範圍是 [0, n-1] 的閉區間。

在第二個 for 語句中,oldlist[j] 指的正是原列表的第 j 個子列表,for i in oldlist[j] 則會遍歷取出 j 子列表的元素,由於 j 取值的區間正對應於原列表的全部索引值,所以,最終達到解題目的。

這種方法足夠優雅了,而且理解也並不難。

然而,我們是否就能滿足於此了呢?有沒有其它奇技淫巧,哦不,是其它高階方法呢?F 同學貢獻了一個思路:

# 方法三,巧用sum:
newlist = sum(oldlist,[])

說實話,這個方法令我大感意外!sum() 函式不是用於求和的麼?怎麼竟然有此用法?

這個寫法利用了什麼原理呢?由於我開始時不知道 sum() 函式可以接收兩個引數,不清楚它們是怎麼用於計算的,所以一度很困惑。但是,當我知道 sum() 的完整用法時,我恍然大悟。

接下來也不賣關子了,直接揭曉吧。

語法:sum(iterable[, start]) ,sum() 函式的第一個引數是可迭代物件,如列表、元組或集合等,第二個引數是起始值,預設為 0 。其用途是以 start 值為基礎,再與可迭代物件的所有元素相“加”。

在上例中,執行效果是 oldlist 中的子列表逐一與第二個引數相加,而列表的加法相當於 extend 操作,所以最終結果是由 [] 擴充成的列表。

這裡有兩個關鍵點:sum() 函式允許帶兩個引數,且第二個引數才是起點。 可能 sum() 函式用於數值求和比較多,然而用於作列表的求和,就有奇效。它比列表推導式更加優雅簡潔!

至此,前面的升級版問題就得到了很好的回答。簡單回顧一下,s 同學最初的問題可以用三種方法實現,第一種方法中規中矩,第二種方法正道進階,而第三種方法旁門左道(沒有貶義,只是說它出人意料,卻效果奇佳)。

這道並不難的問題,在眾人的討論與分享後,竟還引出了很有價值的學習內容。前不久,同樣是群內的一個問題,也產生了同樣的學習效果。

我從中得到了一個啟示:應該多角度地思考問題,設法尋求更優解,同時,基礎知識應掌握牢固,並靈活貫通起來。

學無止境,這裡我還想再開拓一下思路,看看能發現些什麼。

1、如果原列表的元素除了列表,還有其它型別的元素,怎麼把同類的元素歸併在一起呢?

2、如果是一個三維或更高維的列表,怎麼更好地把它們壓縮成一維列表呢?

3、sum() 函式還有什麼知識要點呢?

前兩個問題增加了複雜度,解決起來似乎沒有“靈丹妙藥”了,只能用笨方法分別拆解,逐一解壓。

第三個思考題是關於 sum() 函式本身的用法,我們看看官方文件是怎麼說的:

The iterable’s items are normally numbers, and the start value is not allowed to be a string.

For some use cases, there are good alternatives to sum(). The preferred, fast way to concatenate a sequence of strings is by calling ''.join(sequence). To add floating point values with extended precision, see math.fsum(). To concatenate a series of iterables, consider using itertools.chain().

sum() 的第二個引數不允許是字串。如果用了,會報錯:

TypeError: sum() can't sum strings [use ''.join(seq) instead]

為什麼不建議使用 sum() 來拼接字串呢?哈哈,文件中建議使用 join() 方法,因為它更快。為了不給我們使用慢的方法,它竟特別限定不允許 sum() 的第二個引數是字串。

文件還建議,在某些使用場景時,不要用 sum() ,例如當以擴充套件精度對浮點數求和時,推薦使用 math.fsum()當要拼接一系列的可迭代物件時,應考慮使用 itertools.chain()

itertools.chain() 可以將不同型別的可迭代物件串聯成一個更大的迭代器,這在舊文《Python進階:設計模式之迭代器模式》中也有論及。

不經意間,sum() 函式的注意事項,竟把 Python 其它的進階內容都聯絡起來了。小小的函式,竟成為學習之路上的一個樞紐。

前段時間,我還寫過 range() 、locals() 和 eval() 等內建函式,也是通過一個問題點,而關聯出多個知識點, 獲益良多。這些內建函式/類的魔力可真不小啊。


【本文作者】


豌豆花下貓:某985高校畢業生, 兼具極客思維與人文情懷 。個人公眾號Python貓, 專注python技術、資料科學和深度學習。


推薦閱讀

(點選標題可跳轉閱讀)

什麼時候使用 Lambda 函式?

Python 函數語言程式設計入門教程



覺得本文對你有幫助?請分享給更多人

關注「Python開發者」加星標,提升Python技能

640?wx_fmt=png

好文章,我在看❤️

相關文章