Python字典遍歷的陷阱

orion發表於2021-12-02

眾所周知,Python中常常按照key、value的形式來遍歷字典的items。若value是基本資料型別(int,float等),則是傳的拷貝,是不能直接修改value的:

dict2 = {'A':4, 'B':4}
for _, num in dict2.items():
    num += 1
print(dict2) # {'A': 4, 'B': 4}

這種情況下,若要修改value,只能按照my_dict[key] = ...的形式來修改。

for key, num in dict2.items():
    dict2[key] += 1
print(dict2) # {'A': 5, 'B': 5}

但是如果value是一個列表或者自定義類的物件,那麼傳的是引用,是可以修改的
如下所示:

dict1 = {'A':[1,2,3,4],'B':[3,4,5,6]}
for _, indices in dict1.items():
    indices.append(9)
print(dict1) # {'A': [1, 2, 3, 4, 9], 'B': [3, 4, 5, 6, 9]}

再如下面這個例子;

```python
class MyClass:
    def __init__(self, value):
        self.value = value

my_dict = dict([(i, MyClass(i)) for i in range(3)])
for _, my_obj in my_dict.items():
    print(my_obj.value)
    
print('\n')

for _, my_obj in my_dict.items():
    my_obj.value += 1

for _, my_obj in my_dict.items():
    print(my_obj.value)
    

最後列印輸出:

0
1
2


1
2
3

也就是說,python中字典按照key、value遍歷的時候value實際上相當於函式的引數,它會按照函式的引數傳遞規則進行傳遞,即對基本資料型別傳拷貝,對於物件傳引用

value對於物件傳引用有許多好處,比如我們可以將numpy.random.shuffle()作用於做為字典value的列表,使該列表被打亂:

import random
dict1 = {'A':[1,2,3,4],'B':[3,4,5,6]}
for _, indices in dict1.items():
    random.shuffle(indices)
print(dict1) # {'A': [4, 1, 3, 2], 'B': [4, 5, 6, 3]}

這個例子是我研究論文[1]的開原始碼[2]時發現的,論文中用下列程式碼將每個cluster對應的樣本索引列表打亂:

for _, cluster in clusters.items():
    rng.shuffle(cluster)

另外,該論文也使用下列程式碼將全域性模型的各分量模型拷貝到各client模型:

for learner_id, learner in enumerate(client.learners_ensemble):
    copy_model(learner.model, self.global_learners_ensemble[learner_id].model)

參考文獻

  • [1] Marfoq O, Neglia G, Bellet A, et al. Federated multi-task learning under a mixture of distributions[J]. Advances in Neural Information Processing Systems, 2021, 34.
  • [2] https://github.com/omarfoq/FedEM

相關文章