Como posso remover filas duplicadas?

Question

Mais

Question

Como posso remover filas duplicadas?

Qual é a melhor maneira de remover linhas duplicadas de uma tabela bastante grande SQL Server (ou seja, mais de 300.000 linhas)?

As linhas, naturalmente, não serão duplicatas perfeitas devido à existência do campo de identidade 'RowID'.

**A minha mesa...

RowID int not null identity(1,1) primary key,
Col1 varchar(20) not null,
Col2 varchar(2048) not null,
Col3 tinyint not null

tsql

Popular videos

« Anterior

Jon Galloway

20º agosto 2008 в 9:53

Mais

Há um bom artigo sobre remoção de duplicatas no site de suporte da Microsoft. É bastante conservador - eles fazem tudo em passos separados - mas deve funcionar bem contra tabelas grandes.

Eu já usei auto-ajuda para fazer isso no passado, embora provavelmente pudesse ser fingido com uma cláusula HAVING:

DELETE dupes
FROM MyTable dupes, MyTable fullTable
WHERE dupes.dupField = fullTable.dupField 
AND dupes.secondDupField = fullTable.secondDupField 
AND dupes.uniqueField > fullTable.uniqueField

Ivan Yurchenko

Resposta editada :em

Remove duplicate rows from a table in SQL Server - SQL Server | Microsoft Learn

This article provides a script that you can use to remove duplicate rows from a SQL Server table.

support.microsoft.com

146

0

Adicionar pergunta

Categorias

Todos

Tecnologia

Cultura / Recreação

Vida / Artes

Ciência

Profissional

Negócios

Utilizadores

Todos

Novo

Popular

1

Ксения Комарова

Registrado há 2 semanas

2

Артур «Апер»

Registrado há 1 mês

3

Viktor Malyutin

Registrado há 2 meses

4

Viktor Malyutin

Registrado há 2 meses

5

Syahputra Zhedenk

Registrado há 2 meses

Tem uma pergunta? Adicione-a no sítio e obtenha uma resposta instantânea

pt.kzen.dev

Mark Brackett · Accepted Answer · 2008-08-20T22:00:00+00:00

Assumindo que não há nulos, você "GRUPO POR" as colunas únicas, e "SELECCIONAR" o "MIN (ou MAX)" como a linha a ser mantida. Depois, basta apagar tudo o que não tinha uma linha de identificação:

DELETE FROM MyTable
LEFT OUTER JOIN (
   SELECT MIN(RowId) as RowId, Col1, Col2, Col3 
   FROM MyTable 
   GROUP BY Col1, Col2, Col3
) as KeepRows ON
   MyTable.RowId = KeepRows.RowId
WHERE
   KeepRows.RowId IS NULL

Caso você tenha um GUID em vez de um inteiro, você pode substituir

MIN(RowId)

com

CONVERT(uniqueidentifier, MIN(CONVERT(char(36), MyGuidColumn)))