潛在的Python陷阱

笑虎發表於2015-06-05

Python是一種非常富有表現力的語言。它為我們提供了一個龐大的標準庫和許多內建模組,幫助我們快速完成工作。然而,許多人可能會迷失在它提供的功能中,不能充分利用標準庫,過度重視單行指令碼,以及誤解Python基本結構等。本文是一個關於Python新手可能會陷入的一些陷阱的不完全列表。

不知道Python版本

這是一個在StackOverflow上反覆出現的問題。許多人能寫出在某個版本上完美工作的程式碼,但在他們在自己的系統上安裝有不同版本的Python。要確保你知道你正在使用的Python版本。

你可以通過下邊的程式碼檢視Python版本:

不使用版本管理器

pyenv是一個極好的管理不同Python版本的工具,但很不幸,它只工作在*nix系統上。在Mac系統上,你可以簡單地通過brew install pyenv安裝它,在Linux上,也有一個自動安裝程式

沉迷於一行程式

許多人熱衷於一行程式帶來的興奮感。即使他們的一行解決方案比一個多行解決方案低效,他們也會吹噓。

Python中的一行程式在本質上意味著具有多個表示式的複雜推導。例如:

老實講,我編造了上面的例子。但我看到很多人都寫類似的程式碼。這樣的程式碼在一個星期後就會變得難以理解。如果你想做一些稍微複雜的事情,例如根據條件簡單地在一個列表或集合中新增一個元素,你可能就會犯錯誤。

單行程式碼並不是什麼成就,是的,他們可能看起來很靈活,但不是什麼成就。想象一下,這就像是你在打掃房間時把所有的東西都塞進你的衣櫥。好的程式碼應該是乾淨的,易於閱讀的和高效的。

利用錯誤的方式初始化一個集合

這是一個更微妙的問題,可能讓你措手不及。集合推導很像列表推導。

上面就是集合推導的一個例子。集合就像列表,也是一個容器。所不同的是,一個集合中不能有任何重複的值,而且是無序的。看到集合推導人們經常錯誤地認為{}能初始化一個空集合。但其實不然,它初始化一個空字典。

如果你想初始化一個空集合,可以簡單地呼叫set()方法。

注意一個空集合用set()表示,但是一個包含一些元素的集合就就要用花括號包圍元素來表示。

這和直覺是相反的,因為你期望類似於set([1, 2])的一些東西。

誤解GIL

GIL(全域性直譯器鎖)意味著在Python程式中,任意一個時間點只能有一個執行緒在執行。這意味著當我們建立一個執行緒並希望它並行執行時,它並不會那樣。Python直譯器實際的工作是在不同的執行執行緒之間快速進行切換。但這只是對實際發生事情的一個非常簡單的解釋,實際情況要複雜的多。有很多種並行執行的例項,例如使用本質為C擴充套件的各種庫。但執行Python程式碼時,大部分時間裡它不會並行執行。換句話說,Python中的執行緒並不像Java或C++中的執行緒。

許多人會嘗試為Python辯解,說這些都是真正的執行緒。這確實是真的,但並不能改變這樣一個事實:Python處理執行緒的方式和你期望的方式是不同的。Ruby語言也有相同的情況(Ruby也有一個直譯器鎖)。

指定的解決方案是使用multiprocessing模組。multiprocessing模組提供Process類,它是一個對fork的很好的覆蓋。然而,fork過程比一個執行緒的代價高得多,所以你可能不會每次都能看到效能上的提升,因為不同的process之間需要做大量的工作來進行相互協調。

然而,這個問題並不存在於每一個Python的實現版本中。例如,Python的一個實現PyPy-stm就試圖擺脫GIL(仍未穩定)。建立在其他平臺,如JVM(Jython)或CLR(IronPython),上的Python實現,也沒有GIL的問題。

總之,使用Thread類時要多加小心,你得到的可能不是你想要的。

使用老式類

在Python 2中,有兩種型別的類,分別為“老式”類和“新式”類。如果你使用Python 3,那麼你預設使用“新式”類。為了確保在Python2中使用“新式”類,你需要讓你新建立的每一個類都繼承object類,且類不能已繼承了內建型別,例如int或list。換句話說,你的基類、類如果不繼承其他類,就總是需要繼承object類。

這些“新式”類解決一些老式類的根本缺陷,這一點我們不需要深入瞭解。然而,如果有人感興趣,他們可以在相關文件中找到相關資訊。

按錯誤的方式迭代

對於這門語言的新手來說,下邊的程式碼是非常常見的:

在上邊的例子中,沒有必須呼叫len函式,因為列表迭代實際上要簡單得多:

此外,還有一大堆其他的工具幫助你簡化迭代。例如,可以使用zip同時遍歷兩個列表:

如果你想同時考慮列表變數的索引和值,可以使用enumerate:

在itertools中也有很多有用的函式供你選擇。然而請注意,使用itertools函式並不總是正確的選擇。如果itertools中的一個函式為你試圖解決的問題提供了一個非常方便的解決辦法,例如鋪平一個列表或根據給定的列表建立一個其內容的排列,那就用它吧。但是不要僅僅因為你想要它而去適應你程式碼的一部分。

濫用itertools引發的問題出現的過於頻繁,以至於在StackOverflow上一個德高望重的Python貢獻者已經貢獻他們資料的重要組成部分來解決這些問題。

使用可變的預設引數

我多次見到過如下的程式碼:

永遠不要使用可變的預設引數,可以使用如下的程式碼代替:

與其解釋這個問題是什麼,不如展示下使用可變預設引數的影響:

同一個變數c在函式呼叫的每一次都被反覆引用。這可能有一些意想不到的後果。

總結

這些只是相對來說剛接觸Python的人可能會遇到的一些問題。然而請注意,可能會遇到的問題遠非就這麼些。然而另一些缺陷是人們像使用Java或C++一樣使用Python,並且試圖按他們熟悉的方式使用Python。所以作為本篇文章的一個延續,嘗試深入一些東西,例如Python的super函式。看看類方法、靜態方法和 __slots__等。

打賞支援我翻譯更多好文章,謝謝!

打賞譯者

打賞支援我翻譯更多好文章,謝謝!

潛在的Python陷阱

相關文章