Python裡的引用與拷貝規律

Ofnoname發表於2022-04-05

python的可變不可變與各種淺拷貝深拷貝規則,一併梳理。

Python一切皆引用

在C++/Java裡,int a = 1就是建立變數為a,賦值為1;int b = a就是建立變數b,賦值為a的值。a與b是毫不相干的,即“變數是盒子”,但是這不利於理解Python中的一個變數定義。在Python裡,我們把變數視為“一個實際儲存的引用”(圖源:《流暢的python》)。

image

所以在python裡,a = [1, 2, 3]先分配一塊區域寫入[1,2,3],再讓a來代表它;b = a讓b與a代表了同一個東西,即使a本身消失了(比如del a),也僅僅是撕下來一張標籤而已,b仍然可以訪問這個列表。其他型別也是如此

情況一:直接引用

image

直接引用即b = a,正如上文所說,不會發生拷貝,只是讓b也來代表a代表的區域。此時b就是a,b[0]也就是a[0]。

如果修改了a,等於讓a指向其他物件,與列表無關,所以b沒有變化;而如果修改a[0](或者使用+=,append等),則修改了列表,b[0]也在變化。

image

但對於單個數或者元組字串這種不可變物件,你也可以使用+=,但是他們不支援原地修改,因此實際上會呼叫a = a + b得到的是一個新物件。如a = (1, 2, 3); b = a; a += (4, 5),此時執行a = a + (4, 5),已經指向新的值了,所以b不會改變。

情況二:複製

有些時候我們只編輯列表或字典的副本,所以需要複製,一般最常見的複製方法有:

b = a[:]
b = list(_ for _ in a)
b = copy(a)
b = a.copy()

這些都叫做淺複製,淺複製的時候發生了什麼?
image

淺複製的邏輯將建立一個新物件,然後將每一個值複製一份放入新物件裡,花費線性時間。可以看到複製後b與a完全一致,但是a is b不再成立了,a[0]和b[0]也是不再相關的值,你可以任意修改列表b,都不會影響到a裡的四個元素(紅藍橙綠四個小圓)。

情況三:深複製

但是淺複製仍然有不能解決的問題。我們知道python裡一切皆引用,圖裡的小圓不是盒子而是標籤!,雖然a與b本身已經分開了,但如果有一個元素仍然是列表,那他們其實還是聯絡在一起的。
image
如圖,淺複製時執行了b[1]=a[1],但b[1]和a[1]是引用,因此通過他們訪問的仍然是同一個可變序列,修改a[1]不會導致b[1]變化,但修改a[1][0]卻導致b[1][0]變化。

所以我們引入深複製解決這個問題:

from copy import deepcopy
a = [1, [1, 2, 3], "hello"]
b = deepcopy(a)

深複製的邏輯是,將每一個值複製放進新一個物件裡,而如果這一項也表示一個可變的迭代物件(列表,字典,沒有特殊定製的自定義類),就將這個物件也複製一份。這樣就可以得到一份完全的拷貝。

image

相關文章