重複する行を削除するにはどうしたらいいですか？

Question

さらに

Seibar

質問

重複する行を削除するにはどうしたらいいですか？

かなり大きな`SQL Server**テーブル（例：300,000行以上）から重複する行を削除するには、どのような方法がありますか？

もちろん、RowIDという識別フィールドが存在するので、行は完全な重複ではありません。

マイテーブルの

RowID int not null identity(1,1) primary key,
Col1 varchar(20) not null,
Col2 varchar(2048) not null,
Col3 tinyint not null

DineshDB

編集された質問 28日 3月 2018 в 10:48

tsql

解決策・回答

20日 8月 2008 в 9:53

さらに

Microsoftのサポートサイトに、重複の除去に関する良い記事があります。かなり保守的で、すべてを別々の手順で行うようになっていますが、大きなテーブルに対してはうまく機能するはずです。

私は過去に自己結合を使ってこれを行ったことがありますが、おそらくHAVING句を使ってきれいにすることができるでしょう。

DELETE dupes
FROM MyTable dupes, MyTable fullTable
WHERE dupes.dupField = fullTable.dupField 
AND dupes.secondDupField = fullTable.secondDupField 
AND dupes.uniqueField > fullTable.uniqueField

Ivan Yurchenko

編集した答え 19日 6月 2017 в 11:36

Remove duplicate rows from a table in SQL Server - SQL Server | Microsoft Learn

This article provides a script that you can use to remove duplicate rows from a SQL Server table.

support.microsoft.com

146

0

質問の追加

カテゴリ

すべて

技術情報

文化・レクリエーション

生活・芸術

科学

プロフェッショナル

事業内容

ユーザー

すべて

新しい

人気

1

2

3

4

5

Do you have a question? Add it on the site and get an answer instantly

ja.kzen.dev

Mark Brackett · Accepted Answer · 2008-08-20T22:00:00+00:00

ヌル文字がないと仮定して、ユニークなカラムで GROUP BY して、MIN (or MAX) の RowId を保持する行として SELECT します。その後、行IDを持たないものをすべて削除します。

DELETE FROM MyTable
LEFT OUTER JOIN (
   SELECT MIN(RowId) as RowId, Col1, Col2, Col3 
   FROM MyTable 
   GROUP BY Col1, Col2, Col3
) as KeepRows ON
   MyTable.RowId = KeepRows.RowId
WHERE
   KeepRows.RowId IS NULL

整数ではなくGUIDの場合には

MIN(RowId)

を

CONVERT(uniqueidentifier, MIN(CONVERT(char(36), MyGuidColumn)))