本帖最后由 myskya 于 2019-12-9 11:28 编辑 4 |, P7 u s/ Y2 J4 R( C
问题描述
( z& j. `5 N4 b: B/ R$ x- O查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 6 b! b' K; s# G. k2 R: Y
1.数据去重样例样例数据表 quancheng_test & c& R8 T6 i4 @* i5 t
0 k: d3 R5 N% o8 x- `4 |7 G
功能需求:按 name 进行去重,把 id 查出来。" r, A P4 i- Y6 l# {! ~. z4 b
方案1: - select id from table group by name;
复制代码结果1: 3 @+ G9 ?; S8 A6 b5 q: I
& z& u0 A/ Z, d7 i1 o/ B
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: e! r* |5 u, l
+ I6 d& q& D+ w, E! ` M: }6 c- D5 V2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:- @! H# R- N) a% ]8 [& i! M X* i' B
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: 6 {3 n# Y2 L1 I1 u( c
' `8 g' m4 f* J& U% w. x; d* ?
distinct 是查询出来以后再把重复的去掉! R% ^/ r9 h1 c: N; z
性能上 group 比 distinct 要好很多
, H8 ?) C1 B( I1 e- U/ [7 M8 M. x+ r6 }3 I, ?4 a. |3 a
|