用python刪除重複的圖片
如下目錄下有一些圖片(來自12306的驗證碼)
我怎麼把重複的圖片刪除呢?當然如果不多,比如下面幾張,都是人為複製出來的,掃一眼就可以手動刪除了,如果有10000張這樣的圖片並且命名沒有規則呢?如下圖:
那就用Python來幫我們做吧。
思路:
如果兩個檔案的大小不同,那麼這兩個檔案肯定不同,如果兩個檔案大小相同並且MD5也相同則我們判定為兩個檔案相同
# coding: utf-8
import os
import md5
def getmd5(filename):
file_txt = open(filename, 'rb').read()
m = md5.new(file_txt)
return m.hexdigest()
def main():
path = 'C:\\Users\\wu\\Desktop\\pic\\1\\'
all_size = {}
total_file = 0
total_delete = 0
for file in os.listdir(path):
total_file += 1
real_path = os.path.join(path, file)
if os.path.isfile(real_path) == True:
size = os.stat(real_path).st_size
name_and_md5 = [real_path, '']
if size in all_size.keys():
new_md5 = getmd5(real_path)
if all_size[size][1] == '':
all_size[size][1] = getmd5(all_size[size][0])
if new_md5 in all_size[size]:
os.remove(file)
print '刪除', file
total_delete += 1
else:
all_size[size].append(new_md5)
else:
all_size[size] = name_and_md5
print '檔案個數:', total_file
print '刪除個數:', total_delete
if __name__ == '__main__':
main()
執行結果:刪除的三張圖是我手動複製增加的,與預期完全一樣。
相關文章
- 刪除重複資料
- 刪除oracle重複值Oracle
- JavaScript 刪除重複字元JavaScript字元
- mysql 刪除重複項MySql
- Python 字串,list排序,刪除重複資料Python字串排序
- JavaScript 刪除字串重複字元JavaScript字串字元
- mongodb刪除重複資料MongoDB
- MySQL刪除重複資料MySql
- 刪除Oracle重複記錄Oracle
- oracle刪除重複記錄Oracle
- VSCode刪除重複的空行VSCode
- JavaScript刪除字串中重複的字元JavaScript字串字元
- 如何刪除ArrayList中的重複元素
- CSS 背景圖片水平重複和垂直重複CSS
- JavaScript 刪除陣列重複元素JavaScript陣列
- Remove Duplicate Letters 刪除重複元素REM
- JavaScript刪除字串中重複字元JavaScript字串字元
- JavaScript陣列刪除重複元素JavaScript陣列
- 刪除表裡重複資料
- oracle刪除多餘重複行Oracle
- sqlserver中刪除重複資料SQLServer
- 用SQL語句刪除重複記錄的四種方法SQL
- 刪除排序陣列中的重複項排序陣列
- js刪除陣列中重複的元素JS陣列
- js刪除陣列中的重複元素JS陣列
- db2刪除重複的記錄DB2
- oracle-快速刪除重複的記錄Oracle
- Oracle中刪除重複資料的SqlOracleSQL
- mysql 刪除表中重複的資料MySql
- Oracle查詢重複資料與刪除重複記錄Oracle
- Excel 刪除圖片小技巧Excel
- PostgreSQL刪除表中重複資料SQL
- 解析postgresql 刪除重複資料案例SQL
- JavaScript陣列刪除重複內容JavaScript陣列
- mysql表刪除重複記錄方法MySql
- DB2 刪除重複記錄DB2
- 刪除字串中的所有相鄰重複項字串
- ES6刪除字串中重複的元素字串