在SQL Server中快速刪除重復(fù)記錄

2010-08-28 10:44:50來(lái)源:西部e網(wǎng)作者:


    開(kāi)發(fā)人員的噩夢(mèng)——?jiǎng)h除重復(fù)記錄

  想必每一位開(kāi)發(fā)人員都有過(guò)類似的經(jīng)歷,在對(duì)數(shù)據(jù)庫(kù)進(jìn)行查詢或統(tǒng)計(jì)的時(shí)候不時(shí)地會(huì)碰到由于表中存在重復(fù)的記錄而導(dǎo)致查詢和統(tǒng)計(jì)結(jié)果不準(zhǔn)確。解決該問(wèn)題的辦法就是將這些重復(fù)的記錄刪除,只保留其中的一條。

  在SQL Server中除了對(duì)擁有十幾條記錄的表進(jìn)行人工刪除外,實(shí)現(xiàn)刪除重復(fù)記錄一般都是寫(xiě)一段代碼,用游標(biāo)的方法一行一行檢查,刪除重復(fù)的記錄。因?yàn)檫@種方法需要對(duì)整個(gè)表進(jìn)行遍歷,所以對(duì)于表中的記錄數(shù)不是很大的時(shí)候還是可行的,如果一張表的數(shù)據(jù)達(dá)到上百萬(wàn)條,用游標(biāo)的方法來(lái)刪除簡(jiǎn)直是個(gè)噩夢(mèng),因?yàn)樗鼤?huì)執(zhí)行相當(dāng)長(zhǎng)的一段時(shí)間。

  四板斧——輕松消除重復(fù)記錄

  殊不知在SQL Server中有一種更為簡(jiǎn)單的方法,它不需要用游標(biāo),只要寫(xiě)一句簡(jiǎn)單插入語(yǔ)句就能實(shí)現(xiàn)刪除重復(fù)記錄的功能。為了能清楚地表述,我們首先假設(shè)存在一個(gè)產(chǎn)品信息表Products,其表結(jié)構(gòu)如下:

CREATE TABLE Products (
ProductID int,
ProductName nvarchar (40),
Unit char(2),
UnitPrice money
)

  表中的數(shù)據(jù)如圖1:


  圖1中可以看出,產(chǎn)品Chang和Tofu的記錄在產(chǎn)品信息表中存在重復(fù),F(xiàn)在要?jiǎng)h除這些重復(fù)的記錄,只保留其中的一條。步驟如下:

  第一板斧——建立一張具有相同結(jié)構(gòu)的臨時(shí)表

CREATE TABLE Products_temp (
ProductID int,
ProductName nvarchar (40),
Unit char(2),
UnitPrice money
)

  第二板斧——為該表加上索引,并使其忽略重復(fù)的值

  方法是在企業(yè)管理器中找到上面建立的臨時(shí)表Products _temp,單擊鼠標(biāo)右鍵,選擇所有任務(wù),選擇管理索引,選擇新建。如圖2所示。

  按照?qǐng)D2中圈出來(lái)的地方設(shè)置索引選項(xiàng)。


  第三板斧——拷貝產(chǎn)品信息到臨時(shí)表

insert into Products_temp Select * from Products

  此時(shí)SQL Server會(huì)返回如下提示:

  服務(wù)器: 消息 3604,級(jí)別 16,狀態(tài) 1,行 1

  已忽略重復(fù)的鍵。

  它表明在產(chǎn)品信息臨時(shí)表Products_temp中不會(huì)有重復(fù)的行出現(xiàn)。

  第四板斧——將新的數(shù)據(jù)導(dǎo)入原表

  將原產(chǎn)品信息表Products清空,并將臨時(shí)表Products_temp中數(shù)據(jù)導(dǎo)入,最后刪除臨時(shí)表Products_temp。

delete Products
insert into Products select * from Products_temp
drop table Products_temp


  這樣就完成了對(duì)表中重復(fù)記錄的刪除。無(wú)論表有多大,它的執(zhí)行速度都是相當(dāng)快的,而且因?yàn)閹缀醪挥脤?xiě)語(yǔ)句,所以它也是很安全的。

  小提示:上述方法中刪除重復(fù)記錄取決于創(chuàng)建唯一索引時(shí)選擇的字段,在實(shí)際的操作過(guò)程中讀者務(wù)必首先確認(rèn)創(chuàng)建的唯一索引字段是否正確,以免將有用的數(shù)據(jù)刪除。

 

關(guān)鍵詞:SQLServer