python-進階教程-從序列中移除重複項並保持元素順序不變

shangyj17發表於2018-12-08

原文網址 : https://blog.csdn.net/qq_17753903/article/details/84900211

0.摘要

本文主要介紹去除序列中重複的元素，並保持剩下元素順序不變的方法。

1.轉set()

如果只想去除重複元素，而不關心順序問題，可以將序列轉為set，從而達到簡單快速去重的效果。

a = [1,2,3,4,5,6,5,4,3,2,1,7,8,9]
a = list(set(a))
print(a)
#result:[1, 2, 3, 4, 5, 6, 7, 8, 9]

再次強調，這種方法不能保證剩下的元素順序不變。

2.藉助集合和生成器

def dedupe(items):
    seen = set()
    for item in items:
        if item not in seen:
            yield item
            seen.add(item)

if __name__ == '__main__':
    a = [1, 5, 2, 1, 9, 1, 5, 10]
    print(a)
    print(list(dedupe(a)))

注意：這種方法只有在序列中的元素是可雜湊的時候才適用。

可雜湊：如果一個物件是可雜湊的，那麼在它的生存期內必須是不可變的，他需要有一個__hash__()方法。整數、浮點數、字串、元組都是不可變的。

3.不可雜湊物件

如果序列中物件不可雜湊，那麼可以先將物件轉為可雜湊的。這裡模仿sorted、max()、min()方法，設定一個key引數。

# example2.py
#
# Remove duplicate entries from a sequence while keeping order

def dedupe(items, key=None):
    seen = set()
    for item in items:
        val = item if key is None else key(item)
        if val not in seen:
            yield item
            seen.add(val)

if __name__ == '__main__':
    a = [
        {'x': 2, 'y': 3},
        {'x': 1, 'y': 4},
        {'x': 2, 'y': 3},
        {'x': 2, 'y': 3},
        {'x': 10, 'y': 15}
        ]
    print(a)
    print(list(dedupe(a, key=lambda a: (a['x'],a['y']))))

4.實際應用

在實際應用中，我們處理的資料並不侷限於列表，比如去除重複文字行也可以使用這樣的方法。

with open(file_path,'r') as f:
    for line in dedupe(f):
        ……

Python實用技法第9篇：從序列中移除重複項且保持元素間順序不變
2019-02-16
Python
進行List集合去重操作，分為保持原List集合元素順序和不保持原順序
2018-06-05
leetcode-刪除排序陣列中的重複項+移除元素
2020-10-10
LeetCode排序陣列
如何保持json序列化的順序性？
2021-01-10
JSON
計蒜客移除陣列中的重複元素
2020-04-05
陣列
python-進階教程-對切片進行命名
2018-12-09
Python
python-進階教程-對兩個集合/字典求交集、差集、並集
2018-12-08
Python
C++ 順序容器中訪問元素
2024-10-03
C++
python-進階教程-使用物件屬性進行排序
2018-12-09
Python物件排序
excel重複項篩選標色 excel表格重複項變色
2022-03-02
Excel
CSS 元素層疊順序
2018-05-24
CSS
jQuery調整li元素順序
2018-08-04
jQuery
java陣列中重複元素的去重
2020-12-03
Java陣列
background 複合格式順序
2018-12-06
查詢Set中重複的元素
2018-08-01
sample, choices: 從list中隨機選擇無重複的元素
2024-07-23
隨機
存在重複元素
2020-09-27
JS中動態新增元素並繫結事件，造成程式重複執行
2019-03-04
JS事件
JavaScript 拼接多個陣列並刪除重複元素
2019-06-05
JavaScript陣列
python-進階教程-通過公共鍵對字典列表排序
2018-12-09
Python排序
css元素層疊順序詳解
2018-05-24
CSS
LeetCode之從排序陣列中刪除重複項-Swift
2019-01-11
LeetCode排序陣列Swift
從未排序的連結串列中刪除重複項
2019-01-28
排序
excel怎麼篩選重複的內容 excel找出重複項並提取
2022-02-26
Excel
python-進階教程-根據欄位將記錄分組
2018-12-09
Python
萬彩動畫大師教程 | 改變場景順序
2019-01-23
動畫
golang 陣列去重移除陣列指定元素
2021-06-22
Golang陣列
如何去除有序陣列中的重複元素
2024-08-21
陣列
CSS font 複合屬性順序
2020-05-18
CSS
27，移除元素
2024-03-24
在複習中，我們常常需要對理解困難的元素進一步拆分，新增不同的視角，定義優先順序，甚至刪除元素。...
2018-12-06
Json 序列化、反序列化；重複或迴圈使用時注意事項
2024-07-29
JSON
220、存在重複元素Ⅲ（中等）
2020-11-14
JavaScript li元素的順序隨機打亂
2019-02-28
JavaScript隨機
調整陣列元素順序演算法
2022-04-19
陣列演算法
從中序與後序遍歷序列構造二叉樹
2020-09-25
二叉樹
ES6刪除字串中重複的元素
2018-03-06
字串
js基礎進階–promise和setTimeout執行順序的問題
2019-02-16
JSPromise

python-進階教程-從序列中移除重複項並保持元素順序不變

相關文章