在SQL Server中快速刪除重複記錄(轉)

heying1229發表於2007-06-28
在SQL Server中快速刪除重複記錄
[@more@]

開發人員的噩夢——刪除重複記錄  想必每一位開發人員都有過類似的經歷,在對資料庫進行查詢或統計的時候不時地會碰到由於表中存在重複的記錄而導致查詢和統計結果不準確。解決該問題的辦法就是將這些重複的記錄刪除,只保留其中的一條。  在SQL Server中除了對擁有十幾條記錄的表進行人工刪除外,實現刪除重複記錄一般都是寫一段程式碼,用遊標的方法一行一行檢查,刪除重複的記錄。因為這種方法需要對整個表進行遍歷,所以對於表中的記錄數不是很大的時候還是可行的,如果一張表的資料達到上百萬條,用遊標的方法來刪除簡直是個噩夢,因為它會執行相當長的一段時間。   四板斧——輕鬆消除重複記錄  殊不知在SQL Server中有一種更為簡單的方法,它不需要用遊標,只要寫一句簡單插入語句就能實現刪除重複記錄的功能。為了能清楚地表述,我們首先假設存在一個產品資訊表Products,其表結構如下:

CREATE TABLE Products (
ProductID int,
ProductName nvarchar (40),
Unit char(2),
UnitPrice money
)

   產品ChangTofu的記錄在產品資訊表中存在重複。現在要刪除這些重複的記錄,只保留其中的一條。步驟如下:  第一板斧——建立一張具有相同結構的臨時表

CREATE TABLE Products_temp (
ProductID int,
ProductName nvarchar (40),
Unit char(2),
UnitPrice money
)

  第二板斧——為該表加上索引,並使其忽略重複的值  方法是在企業管理器中找到上面建立的臨時表Products _temp,單擊滑鼠右鍵,選擇所有任務,選擇管理索引,選擇新建一個索引,然後選擇“唯一值”,選擇“忽略重複值”。

  第三板斧——複製產品資訊到臨時表

insert into Products_temp Select * from Products

  此時SQL Server會返回如下提示:  伺服器: 訊息 3604,級別 16,狀態 1,行 1  已忽略重複的鍵。  它表明在產品資訊臨時表Products_temp中不會有重複的行出現。  第四板斧——將新的資料匯入原表  將原產品資訊表Products清空,並將臨時表Products_temp中資料匯入,最後刪除臨時表Products_temp

delete Products
insert into Products select * from Products_temp
drop table Products_temp

  這樣就完成了對錶中重複記錄的刪除。無論表有多大,它的執行速度都是相當快的,而且因為幾乎不用寫語句,所以它也是很安全的。  小提示:上述方法中刪除重複記錄取決於建立唯一索引時選擇的欄位,在實際的操作過程中讀者務必首先確認建立的唯一索引欄位是否正確,以免將有用的資料刪除。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10172717/viewspace-921737/,如需轉載,請註明出處,否則將追究法律責任。

相關文章