本帖最后由 myskya 于 2019-12-9 11:28 编辑 8 ^2 f* @1 |/ D7 j
问题描述
/ u3 d$ `% X G% [+ u: x' _查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
7 V8 [# E6 r3 Z: U3 R1.数据去重样例样例数据表 quancheng_test - K9 g9 b5 q- k. G% n' ~
. S# E9 J% j% n4 N$ I功能需求:按 name 进行去重,把 id 查出来。7 h. {8 h6 Z6 U# y+ y
方案1: - select id from table group by name;
复制代码结果1: 2 U# y/ A& E+ v9 v) J$ X
6 R4 I, W* U" c& W- a/ s
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: 2 c, J+ Q. z2 G. A4 j
5 H7 ~8 ~% t6 n8 \9 f# M; P0 @! r
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
f! ]% I( V8 @4 ~* V% R对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
# N7 p, N+ V6 ~
- J' C4 |8 q" W9 O7 ?- ~distinct 是查询出来以后再把重复的去掉% c* @1 X" G7 R( k9 w' Q- B/ ?% a
性能上 group 比 distinct 要好很多 8 Z" O. q' {* {' E
5 K% o4 ]9 o4 z w6 f' b |