Python實用技法第9篇：從序列中移除重複項且保持元素間順序不變

Mark發表於2019-02-16

原文網址 : https://flycode.co/archives/79168

上一篇文章：Python實用技法第8篇：在兩個字典中尋找相同點
下一篇文章：Python實用技法第10篇：對切片命名

1、需求?

我們想去除序列出現的重複元素，但仍然保持剩下的元素的順序不變。

如果只是想要去重，那麼通常足夠簡單的方法就是構建一個集合：

a=[1,5,4,36,7,8,2,3,5,7]
#結果為：{1, 2, 3, 4, 5, 36, 7, 8}
print(set(a))

2、解決方案?

如果序列中的值是可雜湊的（hashable），那麼這個問題可以通過使用集合和生成器輕鬆解決。

如果一個物件是可雜湊的，那麼它的生存期內必須是不可變的，它需要有一個__hash__()方法。整數、浮點數、字串、元素都是不可變的。

def dedupe(items):
    seen=set()
    for item in items:
        if item not in seen:
            yield item
            seen.add(item)

a=[1,2,3,1,9,1,5,10]
print(list(dedupe(a)))

執行結果：

[1, 2, 3, 9, 5, 10]

只有當序列中的元素是可雜湊的時候才能這麼做。如果想在不可雜湊的物件序列中去除重複項，需要上述程式碼稍作修改：

def dedupe(items,key=None):
    seen=set()
    for item in items:
        value=item if key is None else key(item)
        if value not in seen:
            yield item
            seen.add(value)

a=[
    {`x`:1,`y`:2},
    {`x`:1,`y`:3},
    {`x`:1,`y`:4},
    {`x`:1,`y`:2},
    {`x`:1,`y`:3},
    {`x`:1,`y`:1},

]
print(list(dedupe(a,key=lambda d:(d[`x`],d[`y`]))))

print(list(dedupe(a,key=lambda d:d[`y`])))

執行結果：

[{`x`: 1, `y`: 2}, {`x`: 1, `y`: 3}, {`x`: 1, `y`: 4}, {`x`: 1, `y`: 1}]
[{`x`: 1, `y`: 2}, {`x`: 1, `y`: 3}, {`x`: 1, `y`: 4}, {`x`: 1, `y`: 1}]

這裡的引數key的作用是指定一個函式用來將序列中的元素轉換為可雜湊的型別，那麼做的目的是為了檢測重複項。

上一篇文章：Python實用技法第8篇：在兩個字典中尋找相同點
下一篇文章：Python實用技法第10篇：對切片命名

python-進階教程-從序列中移除重複項並保持元素順序不變
2018-12-08
Python
Python實用技法第15篇：篩選序列中的元素
2019-02-16
Python
Python實用技法第11篇：找出序列中出現次數最多的元素
2019-02-16
Python
Python實用技法第6篇：讓字典保持有序
2019-02-16
Python
進行List集合去重操作，分為保持原List集合元素順序和不保持原順序
2018-06-05
leetcode-刪除排序陣列中的重複項+移除元素
2020-10-10
LeetCode排序陣列
如何保持json序列化的順序性？
2021-01-10
JSON
計蒜客移除陣列中的重複元素
2020-04-05
陣列
Python實用技法第2篇：使用deque保留最新的N個元素
2019-02-16
Python
Python技法-序列拆分
2021-10-09
Python
Python實用技法第1篇：可迭代物件分解為單獨的變數
2019-02-16
Python物件變數
Python實用技法第5篇：一鍵多值字典：defaultdict
2019-02-16
Python
「Python實用祕技07」在pandas中實現自然順序排序
2022-04-17
Python排序
C++ 順序容器中訪問元素
2024-10-03
C++
面試官：怎麼刪除 HashMap 中的重複元素？第 3 種實現思路，99% 的人不會！
2023-03-14
面試HashMap
excel重複項篩選標色 excel表格重複項變色
2022-03-02
Excel
時間序列結構變化分析：Python實現時間序列變化點檢測
2024-09-08
Python
CSS 元素層疊順序
2018-05-24
CSS
Python實用技法第13篇：對自定義類物件排序：attrgetter
2019-02-16
Python物件排序
第2章順序表及其順序儲存
2020-09-25
Python實用技法第24篇：正則：查詢和替換文字
2019-02-16
Python
jQuery調整li元素順序
2018-08-04
jQuery
java陣列中重複元素的去重
2020-12-03
Java陣列
python——集合set不存在重複元素
2020-12-15
Python
Python例項屬性的優先順序分析
2021-09-11
Python
background 複合格式順序
2018-12-06
查詢Set中重複的元素
2018-08-01
Python實用技法第12篇：通過公共鍵對字典列表排序：itemgetter
2019-02-16
Python排序
sample, choices: 從list中隨機選擇無重複的元素
2024-07-23
隨機
存在重複元素
2020-09-27
python運算子及優先順序順序
2018-10-02
Python
一份python實用”技巧“清單（按字母順序）
2019-04-08
Python
css元素層疊順序詳解
2018-05-24
CSS
LeetCode之從排序陣列中刪除重複項-Swift
2019-01-11
LeetCode排序陣列Swift
從未排序的連結串列中刪除重複項
2019-01-28
排序
Python中按字母順序對列表排序
2024-05-10
Python排序
Java初始化靜態變數的時間順序
2020-11-19
Java變數
python 包引入順序
2024-08-29
Python

Python實用技法第9篇：從序列中移除重複項且保持元素間順序不變

1、需求?

2、解決方案?

相關文章