python的可變不可變與各種淺拷貝深拷貝規則,一併梳理。
Python一切皆引用
在C++/Java裡,int a = 1
就是建立變數為a,賦值為1;int b = a
就是建立變數b,賦值為a的值。a與b是毫不相干的,即“變數是盒子”,但是這不利於理解Python中的一個變數定義。在Python裡,我們把變數視為“一個實際儲存的引用”(圖源:《流暢的python》)。
所以在python裡,a = [1, 2, 3]
先分配一塊區域寫入[1,2,3]
,再讓a來代表它;b = a
讓b與a代表了同一個東西,即使a本身消失了(比如del a
),也僅僅是撕下來一張標籤而已,b仍然可以訪問這個列表。其他型別也是如此
情況一:直接引用
直接引用即b = a
,正如上文所說,不會發生拷貝,只是讓b也來代表a代表的區域。此時b就是a,b[0]也就是a[0]。
如果修改了a,等於讓a指向其他物件,與列表無關,所以b沒有變化;而如果修改a[0](或者使用+=,append等),則修改了列表,b[0]也在變化。
但對於單個數或者元組字串這種不可變物件,你也可以使用+=,但是他們不支援原地修改,因此實際上會呼叫a = a + b
得到的是一個新物件。如a = (1, 2, 3); b = a; a += (4, 5)
,此時執行a = a + (4, 5)
,已經指向新的值了,所以b不會改變。
情況二:複製
有些時候我們只編輯列表或字典的副本,所以需要複製,一般最常見的複製方法有:
b = a[:]
b = list(_ for _ in a)
b = copy(a)
b = a.copy()
這些都叫做淺複製,淺複製的時候發生了什麼?
淺複製的邏輯將建立一個新物件,然後將每一個值複製一份放入新物件裡,花費線性時間。可以看到複製後b與a完全一致,但是a is b
不再成立了,a[0]和b[0]也是不再相關的值,你可以任意修改列表b,都不會影響到a裡的四個元素(紅藍橙綠四個小圓)。
情況三:深複製
但是淺複製仍然有不能解決的問題。我們知道python裡一切皆引用,圖裡的小圓不是盒子而是標籤!,雖然a與b本身已經分開了,但如果有一個元素仍然是列表,那他們其實還是聯絡在一起的。
如圖,淺複製時執行了b[1]=a[1],但b[1]和a[1]是引用,因此通過他們訪問的仍然是同一個可變序列,修改a[1]不會導致b[1]變化,但修改a[1][0]卻導致b[1][0]變化。
所以我們引入深複製解決這個問題:
from copy import deepcopy
a = [1, [1, 2, 3], "hello"]
b = deepcopy(a)
深複製的邏輯是,將每一個值複製放進新一個物件裡,而如果這一項也表示一個可變的迭代物件(列表,字典,沒有特殊定製的自定義類),就將這個物件也複製一份。這樣就可以得到一份完全的拷貝。