Guido(Python之父,仁慈的獨裁者)在設計 Python3 的過程中,受一篇文章 “Python warts” 的影響,決定不向後相容,否則無法修復大多數缺陷。—摘錄自《流暢的Python》
你可能從來沒有聽說過學 Java 的糾結是學 JDK6 還是 JDK7,也沒聽說學 PHP 的糾結是學 PHP5 還是 PHP7,但在 Python 社群,有這麼個怪問題:“學 Python 到底是學2還是學3?”這個問題就像月經一樣每隔斷時間就出現在你面前,也成了很多初學者的選擇困惑,這個問題的“始作俑者”當然是 Python 它爹,大家眾說紛紜,有說 Python2 是主流,大公司都在用,你應該學 2 。也有說 Python3 才是未來主流,大多數第三方框架已基本支援 Python3。個人看法是 Python2 還會存在很長一段時間(只要那些用 Python2 的公司還沒倒閉,就一直會存在),你去找工作很有可能就需要用到 2,而 Python3 也是你必須要掌握的,因為越來越多的人會遷移到 3 上去,本質上,它倆是同一門語言,僅僅只是極少部分(1%?並沒有嚴格統計)不相容的地方,所以就沒所謂學哪一個好,學了一個,另一個花很少時間就能掌握。今天給大家介紹 Python2 和 Python3 的一些主要區別。
在進行程式除錯時用得最多的語句可能就是 print
,在 Python 2 中,print 是一條語句,而 Python3 中作為函式存在。有人可能就有疑問了,我在 Python2 中明明也看到當函式使用:
# py2
print("hello") # 等價 print ("hello")
#py3
print("hello")
然而,你看到的只是表象,那麼上面兩個表示式有什麼區別?從輸出結果來看是一樣的,但本質上,前者是把 ("hello")
當作一個整體,而後者 print()
是個函式,接收字串作為引數。
# py2
>>> print("hello", "world")
(`hello`, `world`)
# py3
>>> print("hello", "world")
hello world
這個例子更明顯了,在 py2 中,print語句後面接的是一個元組物件,而在 py3 中,print 函式可以接收多個位置引數。如果希望在 Python2 中 把 print 當函式使用,那麼可以匯入 future 模組 中的 print_function
# py2
>>> print("hello", "world")
(`hello`, `world`)
>>>
>>> from __future__ import print_function
>>> print("hello", "world")
hello world
編碼
Python2 的預設編碼是 asscii,這也是導致 Python2 中經常遇到編碼問題的原因之一,至於是為什麼會使用 asscii 作為預設編碼,原因在於 Python這門語言出來的時候還沒出現 Unicode。Python 3 預設採用了 UTF-8 作為預設編碼,因此你不再需要在檔案頂部寫 # coding=utf-8
了。
# py2
>>> sys.getdefaultencoding()
`ascii`
# py3
>>> sys.getdefaultencoding()
`utf-8`
網上不少文章說通過修改預設編碼格式來解決 Python2 的編碼問題,其實這是個大坑,不要這麼幹。
字串
字串是最大的變化之一,這個變化使得編碼問題降到了最低可能。在 Python2 中,字串有兩個型別,一個是 unicode,一個是 str,前者表示文字字串,後者表示位元組序列,不過兩者並沒有明顯的界限,開發者也感覺很混亂,不明白編碼錯誤的原因,不過在 Python3 中兩者做了嚴格區分,分別用 str 表示字串,byte 表示位元組序列,任何需要寫入文字或者網路傳輸的資料都只接收位元組序列,這就從源頭上阻止了編碼錯誤的問題,關於Unicode與字串,其實在之前的文章進行系統的講解過深入理解Python字元編碼。
py2 | py3 | 表現 | 轉換 | 作用 |
---|---|---|---|---|
str | byte | 位元組 | encode | 儲存、傳輸 |
unicode | str | 字元 | decode | 展示 |
True和False
True 和 False 在 Python2 中是兩個全域性變數(名字),在數值上分別對應 1 和 0,既然是變數,那麼他們就可以指向其它物件,例如:
# py2
>>> True = False
>>> True
False
>>> True is False
True
>>> False = "x"
>>> False
`x`
>>> if False:
... print("?")
...
?
顯然,上面的程式碼違背了 Python 的設計哲學 Explicit is better than implicit.。而 Python3 修正了這個缺陷,True 和 False 變為兩個關鍵字,永遠指向兩個固定的物件,不允許再被重新賦值。
# py3
>>> True = 1
File "<stdin>", line 1
SyntaxError: can`t assign to keyword
迭代器
在 Python2 中很多返回列表物件的內建函式和方法在 Python 3 都改成了返回類似於迭代器的物件,因為迭代器的惰性載入特性使得操作大資料更有效率。Python2 中的 range 和 xrange 函式合併成了 range,如果同時相容2和3,可以這樣:
try:
range = xrange
except:
pass
另外,字典物件的 dict.keys()、dict.values() 方法都不再返回列表,而是以一個類似迭代器的 “view” 物件返回。高階函式 map、filter、zip 返回的也都不是列表物件了。Python2的迭代器必須實現 next
方法,而 Python3 改成了 __next__
nonlocal
我們都知道在Python2中可以在函式裡面可以用關鍵字 global
宣告某個變數為全域性變數,但是在巢狀函式中,想要給一個變數宣告為非區域性變數是沒法實現的,在Pyhon3,新增了關鍵字 nonlcoal
,使得非區域性變數成為可能。
def func():
c = 1
def foo():
c = 12
foo()
print(c)
func() #1
可以對比上面兩段程式碼的輸出結果
def func():
c = 1
def foo():
nonlocal c
c = 12
foo()
print(c)
func() # 12
其實很多內建模組也做了大量調整,Python3 中的模組組織更加清晰,類更加先進,還引入了非同步IO,這次先寫這麼多,下次再繼續。