在一个表中有重复的记录,重复的次数可能是一条或多条,如何在重复记录中只留下一条,删除其他多余的记录,使数据集的每条记录都是唯一的?
本文运用了一种比较笨拙不过逻辑比较清楚的方法,希望大家能提供更好的方法!

1列出表中的重复记录

(sameoda)

SELECT [2].[地级市], Count(*) AS 记录数
FROM 2
GROUP BY [2].[地级市]
HAVING count(*)>1
ORDER BY [地级市];




地级市

记录数

100000951094

2

100000951116

2

100000951127

2

100000951138

2

100000951149

2

100000951150

2

2以下是除去相同记录的过程

1)列出表中的所有重复记录

(表2中重复记录)

SELECT 2.*
FROM 2 RIGHT JOIN sameoda ON [2].[地级市]=[sameoda].[地级市];




ID

编号

地级市

保险货物名称

数量及包装单位

声明价值(元)

运输自

运输到

7469

1466

100000951094

苯扎贝特片、水飞蓟宾胶囊

3箱

18600

天津

佳木斯

5351

1077

100000951094

苯扎贝特片、水飞蓟宾胶囊

3箱

18600

天津

佳木斯

5350

1076

100000951116

水飞蓟宾胶囊

5箱

29000

天津

乌鲁木齐

7468

1465

100000951116

水飞蓟宾胶囊

5箱

29000

天津

乌鲁木齐

5353

1079

100000951127

氟他胺片

4箱

66800

天津

哈尔滨

7471

1468

100000951127

氟他胺片

4箱

66800

天津

哈尔滨

2)从重复记录中找到唯一的一条记录

minbihanhao

SELECT 2.*
FROM 2 LEFT JOIN 表2中重复记录 ON [2].[ID]=[表2中重复记录].[ID]
WHERE [表2中重复记录].[id] Is Null;




地级市

id

100000951094

5351

100000951116

5350

100000951127

5353

100000951138

5354

100000951149

5352

100000951150

5355

3)显示唯一记录的全部信息

allsame1
SELECT 2.*
FROM 2 LEFT JOIN minbihanhao ON ([2].[地级市]=[minbihanhao].[地级市]) AND ([2].[id]=[minbihanhao].[id])
WHERE [minbihanhao].[地级市] Is Not Null
ORDER BY [2].[id];

4)在原表中除去所有相同的记录

dropsame2
SELECT 2.*
FROM 2 LEFT JOIN 表2中重复记录 ON [2].[ID]=[表2中重复记录].[ID]
WHERE [表2中重复记录].[id] Is Null;

5)表2除去重复记录=在原表中除去所有相同的记录+显示唯一记录的全部信息

表2除去重复记录

SELECT *
FROM dropsame2 
UNION select * from
 allsame1;