Python 2 和 Python 3 主要區別有哪些(一)?

劉志軍發表於2017-08-02

Guido(Python之父,仁慈的獨裁者)在設計 Python3 的過程中,受一篇文章 “Python warts” 的影響,決定不向後相容,否則無法修復大多數缺陷。---摘錄自《流暢的Python》

你可能從來沒有聽說過學 Java 的糾結是學 JDK6 還是 JDK7,也沒聽說學 PHP 的糾結是學 PHP5 還是 PHP7,但在 Python 社群,有這麼個怪問題:“學 Python 到底是學2還是學3?”這個問題就像月經一樣每隔斷時間就出現在你面前,也成了很多初學者的選擇困惑,這個問題的“始作俑者”當然是 Python 它爹,大家眾說紛紜,有說 Python2 是主流,大公司都在用,你應該學 2 。也有說 Python3 才是未來主流,大多數第三方框架已基本支援 Python3。個人看法是 Python2 還會存在很長一段時間(只要那些用 Python2 的公司還沒倒閉,就一直會存在),你去找工作很有可能就需要用到 2,而 Python3 也是你必須要掌握的,因為越來越多的人會遷移到 3 上去,本質上,它倆是同一門語言,僅僅只是極少部分(1%?並沒有嚴格統計)不相容的地方,所以就沒所謂學哪一個好,學了一個,另一個花很少時間就能掌握。今天給大家介紹 Python2 和 Python3 的一些主要區別。

print

在進行程式除錯時用得最多的語句可能就是 print,在 Python 2 中,print 是一條語句,而 Python3 中作為函式存在。有人可能就有疑問了,我在 Python2 中明明也看到當函式使用:

# py2
print("hello")  # 等價 print  ("hello")

#py3
print("hello")複製程式碼

然而,你看到的只是表象,那麼上面兩個表示式有什麼區別?從輸出結果來看是一樣的,但本質上,前者是把 ("hello")當作一個整體,而後者 print()是個函式,接收字串作為引數。

# py2
>>> print("hello", "world")
('hello', 'world')

# py3
>>> print("hello", "world")
hello world複製程式碼

這個例子更明顯了,在 py2 中,print語句後面接的是一個元組物件,而在 py3 中,print 函式可以接收多個位置引數。如果希望在 Python2 中 把 print 當函式使用,那麼可以匯入 future 模組 中的 print_function

# py2
>>> print("hello", "world")
('hello', 'world')
>>> 
>>> from __future__ import print_function
>>> print("hello", "world")
hello world複製程式碼

編碼

Python2 的預設編碼是 asscii,這也是導致 Python2 中經常遇到編碼問題的原因之一,至於是為什麼會使用 asscii 作為預設編碼,原因在於 Python這門語言出來的時候還沒出現 Unicode。Python 3 預設採用了 UTF-8 作為預設編碼,因此你不再需要在檔案頂部寫 # coding=utf-8 了。

# py2
>>> sys.getdefaultencoding()
'ascii'

# py3
>>> sys.getdefaultencoding()
'utf-8'複製程式碼

網上不少文章說通過修改預設編碼格式來解決 Python2 的編碼問題,其實這是個大坑,不要這麼幹。

字串

字串是最大的變化之一,這個變化使得編碼問題降到了最低可能。在 Python2 中,字串有兩個型別,一個是 unicode,一個是 str,前者表示文字字串,後者表示位元組序列,不過兩者並沒有明顯的界限,開發者也感覺很混亂,不明白編碼錯誤的原因,不過在 Python3 中兩者做了嚴格區分,分別用 str 表示字串,byte 表示位元組序列,任何需要寫入文字或者網路傳輸的資料都只接收位元組序列,這就從源頭上阻止了編碼錯誤的問題。

py2 py3 表現 轉換 作用
str byte 位元組 encode 儲存、傳輸
unicode str 字元 decode 展示

True和False

True 和 False 在 Python2 中是兩個全域性變數(名字),在數值上分別對應 1 和 0,既然是變數,那麼他們就可以指向其它物件,例如:

# py2
>>> True = False
>>> True
False
>>> True is False
True
>>> False = "x"
>>> False
'x'
>>> if False:
...     print("?")
... 
?複製程式碼

顯然,上面的程式碼違背了 Python 的設計哲學 Explicit is better than implicit.。而 Python3 修正了這個缺陷,True 和 False 變為兩個關鍵字,永遠指向兩個固定的物件,不允許再被重新賦值。

# py3
>>> True = 1
  File "<stdin>", line 1
SyntaxError: can't assign to keyword複製程式碼

迭代器

在 Python2 中很多返回列表物件的內建函式和方法在 Python 3 都改成了返回類似於迭代器的物件,因為迭代器的惰性載入特性使得操作大資料更有效率。Python2 中的 range 和 xrange 函式合併成了 range,如果同時相容2和3,可以這樣:

try:
    range = xrange
except:
    pass複製程式碼

另外,字典物件的 dict.keys()、dict.values() 方法都不再返回列表,而是以一個類似迭代器的 "view" 物件返回。高階函式 map、filter、zip 返回的也都不是列表物件了。Python2的迭代器必須實現 next 方法,而 Python3 改成了 __next__

nonlocal

我們都知道在Python2中可以在函式裡面可以用關鍵字 global 宣告某個變數為全域性變數,但是在巢狀函式中,想要給一個變數宣告為非區域性變數是沒法實現的,在Pyhon3,新增了關鍵字 nonlcoal,使得非區域性變數成為可能。

def func():
    c = 1
    def foo():
        c = 12
    foo()
    print(c)
func()    #1複製程式碼

可以對比上面兩段程式碼的輸出結果

def func():
    c = 1
    def foo():
        nonlocal c
        c = 12
    foo()
    print(c)
func()   # 12複製程式碼

其實很多內建模組也做了大量調整,Python3 中的模組組織更加清晰,類更加先進,還引入了非同步IO,這次先寫這麼多,下次再繼續。

原文:foofish.net/python2_pyt…

公眾號:Python之禪
公眾號:Python之禪

相關文章