本帖最后由 myskya 于 2019-12-9 11:28 编辑 ' [. C3 n3 D# }* v% S5 e$ M
问题描述# s: {$ h3 t+ K- h& _0 y
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
6 b' R" G; }! n- `6 X$ |1.数据去重样例样例数据表 quancheng_test $ t9 p. z( N* W1 w1 F( I6 q& j
/ M& r. u5 f' N9 W功能需求:按 name 进行去重,把 id 查出来。; m V# X3 S9 D
方案1: - select id from table group by name;
复制代码结果1:
) k( E6 ?: F- }5 v+ Z1 S+ p# Z7 J) a7 V
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
5 w2 C9 d9 R. h+ `2 U" P3 R2 x8 p& p3 t5 c; }' w; `* L
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:, S2 t5 }2 o0 Y
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
' _, m2 @7 w4 L/ k( ~( j" `% |$ Q: H z
distinct 是查询出来以后再把重复的去掉
+ I% b% J4 M6 ?6 D性能上 group 比 distinct 要好很多
- B6 a" L* ^; l
. U9 R6 X) y* s8 b |