本帖最后由 myskya 于 2019-12-9 11:28 编辑 F2 H4 V: \. \5 d& D
问题描述
& w9 R1 L, c0 N6 `; C查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 4 q g$ a) ]7 P
1.数据去重样例样例数据表 quancheng_test ' {$ C" a) P% y' E" E
( f6 y, i8 {$ O. O7 `0 Q功能需求:按 name 进行去重,把 id 查出来。
8 f( s/ f- y2 G: V- N: }( i- p7 b方案1: - select id from table group by name;
复制代码结果1:
( M. l7 Y3 p6 Q0 V: k5 o- U/ f* j8 G6 T. G- T
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
x5 [- F' C; C7 H3 A
+ a. p0 A7 v) W9 ` H k8 ?2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
5 e) w* u: g9 Q2 D W* a- J' O( F7 o0 ~对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
( v: Q) M1 z7 o' Z% H" s n w0 W4 b
. k6 ^' _8 K2 z2 A' d/ J' xdistinct 是查询出来以后再把重复的去掉' P7 A x8 W3 U/ X3 [6 Z
性能上 group 比 distinct 要好很多 ; }- w1 b( Z1 ], f
. G1 D+ x5 f( F: r9 H( @0 ?- ]
|