三種方法刪除列表中重複的元素及效率分析!

pythontab發表於2013-06-07

方法一:

使用列表物件的sort()方法對列表進行排序,從最後一個元素開始迴圈迭代列表,判斷相鄰的兩元素是否是否相等!

def methodOne(list):
    list.sort()
    lenList = len(list)
    lastItem = list[lenList-1]
    for i in range(lenList-2,-1,-1):
        if list[i] == lastItem:
            list.remove(list[i])
        else:
            lastItem = list[i]
    return list

方法二:

定義一個臨時列表,迴圈迭代出的元素如果不在臨時表中,則加入,最後返回臨時列表!

def methodTwo(list):
    tempList = []
    for i in list:
        if not i in tempList:
            tempList.append(i)
    return tempList

方法三:

lists=[20,12,34,12,24,34,55,27]
print list(set(lists))

1、方法一相對方法二來說,有更多的額外操作如:排序、賦值。因為在Python中,變數是不可變的,每迭代出一個元素比較不相等後的操作是都是新建立一個區域性變數並賦值而丟棄原變數,這需要消耗更多的記憶體!同時因為排序操作,破壞了相對位置。

2、方法二建立一個臨時列表進行操作,而列表是可變的,每次追加元素都只是在原列表上增加一個索引及值,因而相對方法一來說效率會更高!

3、第三個方法無疑是這三種方法中效率最好的(無論是程式碼的簡潔還是執行效率):set()是內建的資料型別“集合型別”,它是無序的且值是唯一項的!所以set() 執行的結果就是轉為集合且直接去除了重複的元素,再list()則將集合又轉回列表型別。

但是,set()是會破壞了排列順序,如果要保留排序,list(set(lists)) 可改為 sorted(set(lists),key=lists.index)


相關文章