Encontrar valores duplicados en una tabla SQL

Question

Más

Question

Encontrar valores duplicados en una tabla SQL

Es fácil encontrar duplicados con un solo campo:

SELECT name, COUNT(email) 
FROM users
GROUP BY email
HAVING COUNT(email) > 1

Así que si tenemos una tabla

idioma: lang-none -->

ID   NAME   EMAIL
1    John   [email protected]
2    Sam    [email protected]
3    Tom    [email protected]
4    Bob    [email protected]
5    Tom    [email protected]

Esta consulta nos dará John, Sam, Tom, Tom porque todos tienen el mismo email.

Sin embargo, lo que quiero es obtener duplicados con el mismo "correo electrónico" y "nombre".

Es decir, quiero obtener "Tom", "Tom".

La razón por la que necesito esto: Cometí un error y permití insertar valores duplicados de nombre y email. Ahora necesito eliminar/cambiar los duplicados, así que necesito encontrarlos primero.

Pang

Pregunta editada 13º septiembre 2019 в 2:18

Programación

sql

duplicates

Solution / Answer

KM.

7º abril 2010 в 6:22

Más

prueba esto:

declare @YourTable table (id int, name varchar(10), email varchar(50))

INSERT @YourTable VALUES (1,'John','John-email')
INSERT @YourTable VALUES (2,'John','John-email')
INSERT @YourTable VALUES (3,'fred','John-email')
INSERT @YourTable VALUES (4,'fred','fred-email')
INSERT @YourTable VALUES (5,'sam','sam-email')
INSERT @YourTable VALUES (6,'sam','sam-email')

SELECT
    name,email, COUNT(*) AS CountOf
    FROM @YourTable
    GROUP BY name,email
    HAVING COUNT(*)>1

SALIDA:

name       email       CountOf
---------- ----------- -----------
John       John-email  2
sam        sam-email   2

(2 row(s) affected)

si quieres los IDs de los dups usa esto:

SELECT
    y.id,y.name,y.email
    FROM @YourTable y
        INNER JOIN (SELECT
                        name,email, COUNT(*) AS CountOf
                        FROM @YourTable
                        GROUP BY name,email
                        HAVING COUNT(*)>1
                    ) dt ON y.name=dt.name AND y.email=dt.email

SALIDA:

id          name       email
----------- ---------- ------------
1           John       John-email
2           John       John-email
5           sam        sam-email
6           sam        sam-email

(4 row(s) affected)

para eliminar los duplicados prueba:

DELETE d
    FROM @YourTable d
        INNER JOIN (SELECT
                        y.id,y.name,y.email,ROW_NUMBER() OVER(PARTITION BY y.name,y.email ORDER BY y.name,y.email,y.id) AS RowRank
                        FROM @YourTable y
                            INNER JOIN (SELECT
                                            name,email, COUNT(*) AS CountOf
                                            FROM @YourTable
                                            GROUP BY name,email
                                            HAVING COUNT(*)>1
                                        ) dt ON y.name=dt.name AND y.email=dt.email
                   ) dt2 ON d.id=dt2.id
        WHERE dt2.RowRank!=1
SELECT * FROM @YourTable

SALIDA:

id          name       email
----------- ---------- --------------
1           John       John-email
3           fred       John-email
4           fred       fred-email
5           sam        sam-email

(4 row(s) affected)

simhumileco

Respuesta editada 10º abril 2018 в 8:46

348

0

Chris Van Opstal

7º abril 2010 в 6:20

Más

Prueba esto:

SELECT name, email
FROM users
GROUP BY name, email
HAVING ( COUNT(*) > 1 )

110

0

Comunidades relacionadas 2

SQL

852 usuarios

Grupo para gente seria e interesada en el lenguaje SQL. También NoSQL. Como medida para evitar el SPAM, para unirse a este grupo es necesario rellenar un Captcha. https://telegram.me/joinchat/AGFygUDuqou03Lr4jixWbA https://telegram.me/esequele

259 usuarios

Categorías

Todo

Tecnología

Cultura / Recreación

Vida / Artes

Ciencia

Profesional

Negocios

Usuarios

Todo

Nuevo

Popular

1

Ксения Комарова

Registrado hace 2 semanas

2

Артур «Апер»

Registrado hace 1 mes

3

Viktor Malyutin

Registrado hace 2 meses

4

Viktor Malyutin

Registrado hace 2 meses

5

Syahputra Zhedenk

Registrado hace 2 meses

¿Tiene alguna pregunta? Añádela en el sitio y obtén una respuesta al instante

es.kzen.dev

gbn · Accepted Answer · 2010-04-07T18:20:18+00:00

SELECT
    name, email, COUNT(*)
FROM
    users
GROUP BY
    name, email
HAVING 
    COUNT(*) > 1

Simplemente agrupa las dos columnas.

Nota: el estándar ANSI más antiguo es tener todas las columnas no agregadas en el GROUP BY pero esto ha cambiado con la idea de "dependencia funcional":

En la teoría de las bases de datos relacionales, una dependencia funcional es una restricción entre dos conjuntos de atributos en una relación de una base de datos. En otras palabras, la dependencia funcional es una restricción que describe la relación entre los atributos de una relación.

El soporte no es consistente:

PostgreSQL reciente lo soporta.
SQL Server (como en SQL Server 2017) todavía requiere todas las columnas no agregadas en el GROUP BY.
MySQL es impredecible y necesita sql_mode=only_full_group_by:
https://stackoverflow.com/q/10894820/27535;
https://stackoverflow.com/questions/6060241/which-is-the-least-expensive-aggregate-function-in-the-absence-of-any/6060414#6060414 (ver comentarios en la respuesta aceptada).
Oracle no es lo suficientemente convencional (aviso: humor, no sé nada de Oracle).