用一个字段很容易找到重复的内容。
SELECT name, COUNT(email)
FROM users
GROUP BY email
HAVING COUNT(email) > 1
因此,如果我们有一个表
ID NAME EMAIL
1 John [email protected]
2 Sam [email protected]
3 Tom [email protected]
4 Bob [email protected]
5 Tom [email protected]
这个查询将给我们提供John, Sam, Tom, Tom,因为他们都有相同的`email'。
然而,我想得到的是具有相同email
和**name
的重复数据。
也就是说,我想得到"Tom", "Tom"。
我需要这个的原因。我犯了一个错误,允许插入重复的姓名
和电子邮件
值。现在我需要删除/改变这些重复的值,所以我需要先*找到它们。
SELECT
name, email, COUNT(*)
FROM
users
GROUP BY
name, email
HAVING
COUNT(*) > 1
只需在两列上分组。
注意:老的ANSI标准是在GROUP BY中包含所有非分组的列,但是随着"功能依赖"的想法,这种做法已经改变。
在关系数据库理论中,功能依赖是数据库中关系的两组属性之间的约束。换句话说,功能依赖是一种描述关系中属性之间关系的约束。
支持是不一致的。
sql_mode=only_full_group_by
。试试这个。
declare @YourTable table (id int, name varchar(10), email varchar(50))
INSERT @YourTable VALUES (1,'John','John-email')
INSERT @YourTable VALUES (2,'John','John-email')
INSERT @YourTable VALUES (3,'fred','John-email')
INSERT @YourTable VALUES (4,'fred','fred-email')
INSERT @YourTable VALUES (5,'sam','sam-email')
INSERT @YourTable VALUES (6,'sam','sam-email')
SELECT
name,email, COUNT(*) AS CountOf
FROM @YourTable
GROUP BY name,email
HAVING COUNT(*)>1
OUTPUT。
name email CountOf
---------- ----------- -----------
John John-email 2
sam sam-email 2
(2 row(s) affected)
如果你想要ups的ID,请使用这个。
SELECT
y.id,y.name,y.email
FROM @YourTable y
INNER JOIN (SELECT
name,email, COUNT(*) AS CountOf
FROM @YourTable
GROUP BY name,email
HAVING COUNT(*)>1
) dt ON y.name=dt.name AND y.email=dt.email
OUTPUT:
id name email
----------- ---------- ------------
1 John John-email
2 John John-email
5 sam sam-email
6 sam sam-email
(4 row(s) affected)
要删除重复的内容,请尝试。
DELETE d
FROM @YourTable d
INNER JOIN (SELECT
y.id,y.name,y.email,ROW_NUMBER() OVER(PARTITION BY y.name,y.email ORDER BY y.name,y.email,y.id) AS RowRank
FROM @YourTable y
INNER JOIN (SELECT
name,email, COUNT(*) AS CountOf
FROM @YourTable
GROUP BY name,email
HAVING COUNT(*)>1
) dt ON y.name=dt.name AND y.email=dt.email
) dt2 ON d.id=dt2.id
WHERE dt2.RowRank!=1
SELECT * FROM @YourTable
OUTPUT:
id name email
----------- ---------- --------------
1 John John-email
3 fred John-email
4 fred fred-email
5 sam sam-email
(4 row(s) affected)