Python中去除重複資料的方法有哪些?
眾所周知,Python是一門強大的程式語言,可以進行資料抓取、資料分析等,能幫助我們高效地處理資料。但在進行資料處理的過程中,我們經常會遇到重複資料的問題,那麼Python如何去除重複資料?在Python中,有多種方法可以去除重複資料,以下是具體內容介紹。
1、使用set()函式去重
set()是Python中的一個內建函式,用於建立一個集合。集合是無序不重複的元素集合,可以方便地用於去重操作。我們可以將要去重的資料轉換為集合,然後再轉換為列表,即可去除重複資料。示例程式碼:
```
data = [1, 2, 3, 4, 1, 2, 5, 6, 3, 7, 8, 9, 9]
data = list(set(data))
print(data)
```
輸出結果為:[1, 2, 3, 4, 5, 6, 7, 8, 9]
2、使用pandas庫去重
pandas是Python中一種常用的資料處理庫,可以方便地進行資料清洗、轉換、分析等操作。pandas提供了drop_duplicates()函式,可以用於去除dataframe中的重複資料。示例程式碼:
```
import pandas as pd
data = {'A': [1, 2, 3, 4, 1, 2, 5, 6, 3, 7, 8, 9, 9],
'B': ['a', 'b', 'c', 'd', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'h']}
df = pd.DataFrame(data)
df = df.drop_duplicates()
print(df)
```
輸出結果為:
```
A B
0 1 a
1 2 b
2 3 c
3 4 d
6 5 c
7 6 d
9 7 f
10 8 g
11 9 h
```
3、使用numpy庫去重
numpy是Python中一個常用的科學計算庫,可以用於陣列操作、線性代數運算等。numpy提供了unique()函式,可以用於去除陣列中的重複元素。示例程式碼:
```
import numpy as np
data = [1, 2, 3, 4, 1, 2, 5, 6, 3, 7, 8, 9, 9]
data = np.unique(data)
print(data)
```
輸出結果為:[1 2 3 4 5 6 7 8 9]
4、使用hash去重
hash是一種將任意長度的訊息壓縮到某一固定長度的演算法。Python中的字典使用了hash表來實現,因此可以利用字典的特性進行去重操作。示例程式碼:
```
data = [1, 2, 3, 4, 1, 2, 5, 6, 3, 7, 8, 9, 9]
result = list(dict.fromkeys(data))
print(result)
```
輸出結果為:[1, 2, 3, 4, 5, 6, 7, 8, 9]
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69952527/viewspace-2993097/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- UNIX下去除檔案中重複資料的方法(轉)
- mongodb去除重複的資料MongoDB
- python中列表如何去除重複Python
- mongodb如何去除重複資料MongoDB
- 測試去除重複資料
- 資料處理之去除重複資料
- php資料庫資料如何去除重複資料呢?PHP資料庫
- 陣列去除重複的幾個方法陣列
- 如何去除 EXCEL 檔案中的重複行Excel
- 如何去除有序陣列中的重複元素陣列
- php多維陣列去除重複值的方法PHP陣列
- 利用excel去除txt文字中重複項Excel
- js去除重複字串JS字串
- asp.net 之StringBuilder 去除重複資料ASP.NETUI
- python中list有哪些方法Python
- 資料清洗的方法有哪些?
- SQL Server中刪除重複資料的幾個方法SQLServer
- mysql查詢表裡的重複資料方法和刪除重複資料MySql
- dataset 判斷整列是否有重複,找出重複資料
- Java基礎之去除List集合中的重複元素Java
- 如何去除 Excel 2010 中的重複項Excel
- List中去除重複物件物件
- json字串返回的資料有重複的資料JSON字串
- 資料清洗有哪些方法?
- 使用HashSet<>去除重複元素的集合
- 資料採集的方法有哪些
- 常見的資料整合有哪些方法?有哪些分類?
- 幹掉 “重複程式碼” 的技巧有哪些
- Java 去掉字串中的重複資料Java字串
- python列出資料夾所有檔案有哪些方法?Python
- Java中父類方法重寫有哪些需要注意的?Java
- C# datatable中重複資料去重C#
- Oracle中刪除表中的重複資料Oracle
- python常用的資料庫有哪些?Python資料庫
- 有哪些常見的資料探勘方法?
- 常用的資料分析方法論有哪些?
- javascript去除陣列中重複元素程式碼例項JavaScript陣列
- sqlserver中刪除重複資料SQLServer