潛在的Python陷阱

笑虎發表於2015-06-05

Python是一種非常富有表現力的語言。它為我們提供了一個龐大的標準庫和許多內建模組，幫助我們快速完成工作。然而，許多人可能會迷失在它提供的功能中，不能充分利用標準庫，過度重視單行指令碼，以及誤解Python基本結構等。本文是一個關於Python新手可能會陷入的一些陷阱的不完全列表。

不知道Python版本

這是一個在StackOverflow上反覆出現的問題。許多人能寫出在某個版本上完美工作的程式碼，但在他們在自己的系統上安裝有不同版本的Python。要確保你知道你正在使用的Python版本。

你可以通過下邊的程式碼檢視Python版本：

$ python --version
Python 2.7.9

1 2	$ python --version Python 2.7.9

不使用版本管理器

pyenv是一個極好的管理不同Python版本的工具，但很不幸，它只工作在*nix系統上。在Mac系統上，你可以簡單地通過brew install pyenv安裝它，在Linux上，也有一個自動安裝程式。

沉迷於一行程式

許多人熱衷於一行程式帶來的興奮感。即使他們的一行解決方案比一個多行解決方案低效，他們也會吹噓。

Python中的一行程式在本質上意味著具有多個表示式的複雜推導。例如：

l = [m for a, b in zip(this, that) if b.method(a) != b for m in b if not m.method(a, b) and reduce(lambda x, y: a + y.method(), (m, a, b))]

1	l = [m for a, b in zip(this, that) if b.method(a) != b for m in b if not m.method(a, b) and reduce(lambda x, y: a + y.method(), (m, a, b))]

老實講，我編造了上面的例子。但我看到很多人都寫類似的程式碼。這樣的程式碼在一個星期後就會變得難以理解。如果你想做一些稍微複雜的事情，例如根據條件簡單地在一個列表或集合中新增一個元素，你可能就會犯錯誤。

單行程式碼並不是什麼成就，是的，他們可能看起來很靈活，但不是什麼成就。想象一下，這就像是你在打掃房間時把所有的東西都塞進你的衣櫥。好的程式碼應該是乾淨的，易於閱讀的和高效的。

利用錯誤的方式初始化一個集合

這是一個更微妙的問題，可能讓你措手不及。集合推導很像列表推導。

>>> { n for n in range(10) if n % 2 == 0 }
{0, 8, 2, 4, 6}
>>> type({ n for n in range(10) if n % 2 == 0 })

>>> { n for n in range(10) if n % 2 == 0 }

{0, 8, 2, 4, 6}

>>> type({ n for n in range(10) if n % 2 == 0 })

上面就是集合推導的一個例子。集合就像列表，也是一個容器。所不同的是，一個集合中不能有任何重複的值，而且是無序的。看到集合推導人們經常錯誤地認為{}能初始化一個空集合。但其實不然，它初始化一個空字典。

>>> {}
{}
>>> type({})

>>> {}

{}

>>> type({})

如果你想初始化一個空集合，可以簡單地呼叫set()方法。

>>> set()
set()
>>> type(set())

>>> set()

set()

>>> type(set())

注意一個空集合用set()表示，但是一個包含一些元素的集合就就要用花括號包圍元素來表示。

>>> s = set()
>>> s
set()
>>> s.add(1)
>>> s
{1}
>>> s.add(2)
>>> s
{1, 2}

>>> s = set()

>>> s

set()

>>> s.add(1)

>>> s

{1}

>>> s.add(2)

>>> s

{1, 2}

這和直覺是相反的，因為你期望類似於set([1, 2])的一些東西。

誤解GIL

GIL（全域性直譯器鎖）意味著在Python程式中，任意一個時間點只能有一個執行緒在執行。這意味著當我們建立一個執行緒並希望它並行執行時，它並不會那樣。Python直譯器實際的工作是在不同的執行執行緒之間快速進行切換。但這只是對實際發生事情的一個非常簡單的解釋，實際情況要複雜的多。有很多種並行執行的例項，例如使用本質為C擴充套件的各種庫。但執行Python程式碼時，大部分時間裡它不會並行執行。換句話說，Python中的執行緒並不像Java或C++中的執行緒。

許多人會嘗試為Python辯解，說這些都是真正的執行緒。這確實是真的，但並不能改變這樣一個事實：Python處理執行緒的方式和你期望的方式是不同的。Ruby語言也有相同的情況（Ruby也有一個直譯器鎖）。

指定的解決方案是使用multiprocessing模組。multiprocessing模組提供Process類，它是一個對fork的很好的覆蓋。然而，fork過程比一個執行緒的代價高得多，所以你可能不會每次都能看到效能上的提升，因為不同的process之間需要做大量的工作來進行相互協調。

然而，這個問題並不存在於每一個Python的實現版本中。例如，Python的一個實現PyPy-stm就試圖擺脫GIL（仍未穩定）。建立在其他平臺，如JVM（Jython）或CLR（IronPython），上的Python實現，也沒有GIL的問題。

總之，使用Thread類時要多加小心，你得到的可能不是你想要的。

使用老式類

在Python 2中，有兩種型別的類，分別為“老式”類和“新式”類。如果你使用Python 3，那麼你預設使用“新式”類。為了確保在Python2中使用“新式”類，你需要讓你新建立的每一個類都繼承object類，且類不能已繼承了內建型別，例如int或list。換句話說，你的基類、類如果不繼承其他類，就總是需要繼承object類。

class MyNewObject(object):
# stuff here

1 2	class MyNewObject(object): # stuff here

這些“新式”類解決一些老式類的根本缺陷，這一點我們不需要深入瞭解。然而，如果有人感興趣，他們可以在相關文件中找到相關資訊。

按錯誤的方式迭代

對於這門語言的新手來說，下邊的程式碼是非常常見的：

for name_index in range(len(names)):
print(names[name_index])

1 2	for name_index in range(len(names)): print(names[name_index])

在上邊的例子中，沒有必須呼叫len函式，因為列表迭代實際上要簡單得多：

for name in names:
print(name)

1 2	for name in names: print(name)

此外，還有一大堆其他的工具幫助你簡化迭代。例如，可以使用zip同時遍歷兩個列表：

for cat, dog in zip(cats, dogs):
print(cat, dog)

1 2	for cat, dog in zip(cats, dogs): print(cat, dog)

如果你想同時考慮列表變數的索引和值，可以使用enumerate：

for index, cat in enumerate(cats):
print(cat, index)

1 2	for index, cat in enumerate(cats): print(cat, index)

在itertools中也有很多有用的函式供你選擇。然而請注意，使用itertools函式並不總是正確的選擇。如果itertools中的一個函式為你試圖解決的問題提供了一個非常方便的解決辦法，例如鋪平一個列表或根據給定的列表建立一個其內容的排列，那就用它吧。但是不要僅僅因為你想要它而去適應你程式碼的一部分。

濫用itertools引發的問題出現的過於頻繁，以至於在StackOverflow上一個德高望重的Python貢獻者已經貢獻他們資料的重要組成部分來解決這些問題。

使用可變的預設引數

我多次見到過如下的程式碼：

def foo(a, b, c=[]):
# append to c
# do some more stuff

def foo(a, b, c=[]):

# append to c

# do some more stuff

永遠不要使用可變的預設引數，可以使用如下的程式碼代替：

def foo(a, b, c=None):
if c is None:
c = []
# append to c
# do some more stuff

def foo(a, b, c=None):

if c is None:

c = []

# append to c

# do some more stuff

與其解釋這個問題是什麼，不如展示下使用可變預設引數的影響：

In[2]: def foo(a, b, c=[]):
... c.append(a)
... c.append(b)
... print(c)
...
In[3]: foo(1, 1)
[1, 1]
In[4]: foo(1, 1)
[1, 1, 1, 1]
In[5]: foo(1, 1)
[1, 1, 1, 1, 1, 1]

In[2]: def foo(a, b, c=[]):

... c.append(a)

... c.append(b)

... print(c)

...

In[3]: foo(1, 1)

[1, 1]

In[4]: foo(1, 1)

[1, 1, 1, 1]

In[5]: foo(1, 1)

[1, 1, 1, 1, 1, 1]

同一個變數c在函式呼叫的每一次都被反覆引用。這可能有一些意想不到的後果。

總結

這些只是相對來說剛接觸Python的人可能會遇到的一些問題。然而請注意，可能會遇到的問題遠非就這麼些。然而另一些缺陷是人們像使用Java或C++一樣使用Python，並且試圖按他們熟悉的方式使用Python。所以作為本篇文章的一個延續，嘗試深入一些東西，例如Python的super函式。看看類方法、靜態方法和 __slots__等。

打賞支援我翻譯更多好文章，謝謝！
打賞譯者

打賞支援我翻譯更多好文章，謝謝！

潛在的Python陷阱

Python中eval帶來的潛在風險
2020-08-19
Python
Python 中 eval 帶來的潛在風險
2015-11-17
Python
教你在Python中實現潛在語義分析
2018-12-07
Python
python關於+=的陷阱
2020-10-24
Python
Python字典遍歷的陷阱
2021-12-02
Python
Python技巧和陷阱
2015-05-27
Python
十二個坑爹的Python陷阱
2018-12-03
Python
潛在語義分析
2016-12-27
坑爹的Python陷阱（避坑指南）
2020-04-06
Python
python的socket.recv函式陷阱
2018-08-04
Python函式
Golang 中 defer Close() 的潛在風險
2021-11-22
Golang
python中from module import * 的一個陷阱
2014-07-20
PythonImport
每行程式碼都有潛在的 bug
2015-05-08
行程
陷阱！python引數預設值
2016-10-01
Python
開發中常遇到的Python陷阱和注意點
2016-02-03
Python
雲端計算潛在的五個問題
2014-08-05
Python中的一些陷阱與技巧小結
2018-06-05
Python
CRM系統對企業的潛在影響
2021-09-14
大資料的潛在影響及制度需求
2014-08-05
大資料
警惕！Python 中少為人知的 10 個安全陷阱！
2022-02-14
Python
程式設計師必知的 Python 陷阱與缺陷列表
2017-07-18
程式設計師Python
批量更新的陷阱?
2006-03-03
異類框架BigDL，TensorFlow的潛在殺器
2019-06-24
框架
郵件伺服器潛在漏洞的保護方法
2020-09-09
伺服器
AI大模型的潛在風險，如何做好管控？
2024-11-15
AI大模型
React State Hooks的閉包陷阱，在使用Hooks之前必須掌握
2019-03-18
ReactHook
如何修復使用 Python ORM 工具 SQLAlchemy 時的常見陷阱
2019-11-19
PythonORMSQL
使用Python和Java呼叫Shell指令碼時的死鎖陷阱
2019-02-16
PythonJava指令碼
Python函式引數預設值的陷阱和原理深究
2015-03-18
Python函式
5G基礎設施的潛在威脅向量
2021-09-09
軟體工程：墨菲定律，潛在問題管理的藝術
2023-04-18
軟體工程
WebRTC 的三個“陷阱”
2019-03-03
Web
JavaScript 的常見“陷阱”
2014-05-09
JavaScript
dbca刪庫的陷阱
2015-05-11
在邊緣使用MRAM是其另一個潛在應用
2021-04-25
為什麼說DFMEA識別的是“潛在”的特殊特性？
2023-02-16
1.6億潛在玩家！遊戲界的中年男人爭奪戰
2019-12-04
遊戲
「深度」A/B測試中的因果推斷——潛在結果模型
2019-01-14
模型

潛在的Python陷阱

打賞支援我翻譯更多好文章，謝謝！

相關文章