Поиск дубликатов значений в таблице SQL

Редактировал ответ 9-го февраля 2022 в 10:22

Chris Van Opstal

7-го апреля 2010 в 6:20

Дополнительно

Попробуйте это:

SELECT name, email
FROM users
GROUP BY name, email
HAVING ( COUNT(*) > 1 )

Анна Убогих 5970

110

AncAinu

14-го марта 2016 в 2:22

Дополнительно

Если вы хотите удалить дубликаты, здесь'ы гораздо более простой способ сделать это, чем того, чтобы найти четных/нечетных строк в трех суб-выберите:

SELECT id, name, email 
FROM users u, users u2
WHERE u.name = u2.name AND u.email = u2.email AND u.id > u2.id

И так чтобы удалить:

DELETE FROM users
WHERE id IN (
    SELECT id/*, name, email*/
    FROM users u, users u2
    WHERE u.name = u2.name AND u.email = u2.email AND u.id > u2.id
)

Гораздо легче читать и понимать, ИМХО

Примечание: единственная проблема заключается в том, что вы должны выполнить запрос, пока нет рядов удален, поскольку вы удаляете только 1 из каждого дублировать каждый раз

62

gaurav singh

31-го декабря 2013 в 10:07

Дополнительно

Попробуйте следующее:

SELECT * FROM
(
    SELECT Id, Name, Age, Comments, Row_Number() OVER(PARTITION BY Name, Age ORDER By Name)
        AS Rank 
        FROM Customers
) AS B WHERE Rank>1

41

PRADEEPTA VIRLLEY

22-го июля 2015 в 7:12

Дополнительно

 SELECT name, email 
    FROM users
    WHERE email in
    (SELECT email FROM users
    GROUP BY email 
    HAVING COUNT(*)>1)

27

Indivision Dev

17-го ноября 2015 в 10:21

Дополнительно

Немного опоздала на вечеринку, но я нашел очень крутой обходной путь, чтобы найти все повторяющиеся идентификаторы:

SELECT GROUP_CONCAT( id )
FROM users
GROUP BY email
HAVING ( COUNT(email) > 1 )

22

Редактировал ответ 30-го января 2018 в 8:50

Tanmay Nehete

13-го сентября 2014 в 4:03

Дополнительно

попробуйте этот код

WITH CTE AS

( SELECT Id, Name, Age, Comments, RN = ROW_NUMBER()OVER(PARTITION BY Name,Age ORDER BY ccn)
FROM ccnmaster )
select * from CTE

Tanmay Nehete

19

Martin Silovský

22-го февраля 2017 в 3:02

Дополнительно

Этот выбор/удаляет все повторяющиеся записи, за исключением одной записи из каждой группы дубликатов. Итак, удалить все уникальные записи + одна запись из каждой группы дубликатов.

Выберите продублирую:

SELECT *
FROM table
WHERE
    id NOT IN (
        SELECT MIN(id)
        FROM table
        GROUP BY column1, column2
);

Удалить дубликаты:

DELETE FROM table
WHERE
    id NOT IN (
        SELECT MIN(id)
        FROM table
        GROUP BY column1, column2
);

Быть в курсе большого количества записей, это может привести к проблемам с производительностью.

17

xDBA

16-го июня 2014 в 8:50

Дополнительно

В случае, если вы работаете с Oracle, этот способ будет предпочтительным:

create table my_users(id number, name varchar2(100), email varchar2(100));

insert into my_users values (1, 'John', '[email protected]');
insert into my_users values (2, 'Sam', '[email protected]');
insert into my_users values (3, 'Tom', '[email protected]');
insert into my_users values (4, 'Bob', '[email protected]');
insert into my_users values (5, 'Tom', '[email protected]');

commit;

select *
  from my_users
 where rowid not in (select min(rowid) from my_users group by name, email);

15

Narendra

8-го сентября 2016 в 6:41

Дополнительно

select name, email
, case 
when ROW_NUMBER () over (partition by name, email order by name) > 1 then 'Yes'
else 'No'
end "duplicated ?"
from users

shekhar singh

26-го августа 2014 в 10:07

Дополнительно

Если вы хотите, чтобы увидеть, если есть любые повторяющиеся строки в таблице, я использовал ниже запрос:

create table my_table(id int, name varchar(100), email varchar(100));

insert into my_table values (1, 'shekh', '[email protected]');
insert into my_table values (1, 'shekh', '[email protected]');
insert into my_table values (2, 'Aman', '[email protected]');
insert into my_table values (3, 'Tom', '[email protected]');
insert into my_table values (4, 'Raj', '[email protected]');

Select COUNT(1) As Total_Rows from my_table 
Select Count(1) As Distinct_Rows from ( Select Distinct * from my_table) abc

Darrel Lee

1-го июля 2016 в 7:09

Дополнительно

Это самая легкая вещь, которую я'вэ придумать. Он использует обобщенное табличное выражение (CTE) и окно перегородки (я думаю, что эти функции в SQL 2008 и позже).

В этом примере выполняется поиск всех студентов с одинаковыми имя и DOB. Поля, которые вы хотите проверить на дублирование перейти в пункт. Вы можете включать любые другие поля, которые вы хотите в проекции.

with cte (StudentId, Fname, LName, DOB, RowCnt)
as (
SELECT StudentId, FirstName, LastName, DateOfBirth as DOB, SUM(1) OVER (Partition By FirstName, LastName, DateOfBirth) as RowCnt
FROM tblStudent
)
SELECT * from CTE where RowCnt > 1
ORDER BY DOB, LName

Debendra Dash

12-го сентября 2016 в 6:18

Дополнительно

select id,name,COUNT(*) from India group by Id,Name having COUNT(*)>1

Debendra Dash

26-го сентября 2016 в 12:23

Дополнительно

С помощью КТР также мы можем найти повторяющиеся значения такой

with MyCTE
as
(
select Name,EmailId,ROW_NUMBER() over(PARTITION BY EmailId order by id) as Duplicate from [Employees]

)
select * from MyCTE where Duplicate>1

7

Muhammad Tahir

11-го декабря 2014 в 10:28

Дополнительно

Как мы можем посчитать повторяющиеся значения?? либо он повторяется 2 раза или больше 2. просто подсчитайте их, а не группы мудр.

как просто, как

select COUNT(distinct col_01) from Table_01

7

naveed

15-го октября 2014 в 3:38

Дополнительно

 select emp.ename, emp.empno, dept.loc 
          from emp
 inner join dept 
          on dept.deptno=emp.deptno
 inner join
    (select ename, count(*) from
    emp
    group by ename, deptno
    having count(*) > 1)
 t on emp.ename=t.ename order by emp.ename
/

6

veritaS

14-го апреля 2016 в 11:02

Дополнительно

Это должно также работать, может дать ему попробовать.

  Select * from Users a
            where EXISTS (Select * from Users b 
                where (     a.name = b.name 
                        OR  a.email = b.email)
                     and a.ID != b.id)

Особенно хороши в вашем случае, если вы ищите дубликаты, которые имеют какой-то префикс или общие изменения, как, например, новый домен в Почте. затем вы можете использовать замените() на эти колонки

5

Panky031

22-го июля 2016 в 8:29

Дополнительно

SELECT * FROM users u where rowid = (select max(rowid) from users u1 where
u.email=u1.email);

4

DBA - русскоговорящее сообщество

Похожие сообщества 4

3 816 пользователей

Общаемся и обсуждаем темы, посвященные DBA, PostgreSQL, Redis, MongoDB, MySQL, neo4j, riak и т.д. См. также: @devops_ru, @kubernetes_ru, @docker_ru, @nodejs_ru Рекомендуем сразу отключить уведомления, чтобы пребывание здесь было полезным и комфортным.

SQL JOBS

2 697 пользователей

Обязательны: компания, город, позиция, вилка, наличие удалёнки, требования, контакты. Бан за рекламу, сексизм, расизм и неадекватный обсёр объявлений

sql_ninja

2 661 пользователей

Канал для тех, кто знает или интересуется SQL 🛢 Взаимная помощь и позитив =) Вакансии тут - @sql_jobs Бан за: оскорбления, спам, фри рекламу, расизм, сексизм. Наш MSSQL канал - @sqlcom По рекламе: @aveLestat

Lazarus : Database (Firebird, mySQL, SQLite, PostgreSQL, ...)

38 пользователей

Базы данных в Lazarus https://t.me/Delphi_Lazarus (по-русски) https://t.me/Delphi_Lazarus_offtop https://t.me/freepascal_en (по-английски) по темам: https://t.me/Lazarus_Database https://t.me/Lazarus_Graphics https://t.me/Lazarus_Android