本帖最后由 myskya 于 2019-12-9 11:28 编辑
+ J& M3 J/ K5 U" I问题描述
9 J0 U# n& b& a/ c查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 ( o1 H6 F, g4 v( ?, N" S
1.数据去重样例样例数据表 quancheng_test
$ {- Z% @. P% N& ^1 x, f' m: g, _% @' m
功能需求:按 name 进行去重,把 id 查出来。/ d+ ^* J2 g& W
方案1: - select id from table group by name;
复制代码结果1:
+ ~$ b1 ^$ [+ s; m
+ p, ~3 ]' l/ }4 k方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: $ s: D; w2 W! a: n2 E. ^
E0 S- c/ `3 V* |2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:0 K$ ^1 H6 E4 O% W V
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
2 v( r' _6 ]1 Q7 Q. i( y
. e0 g) X5 _8 @+ j; P5 a9 Pdistinct 是查询出来以后再把重复的去掉
; O# O+ x" v5 h1 \* f6 x; a性能上 group 比 distinct 要好很多
" u1 k4 F. i) K) C# W
0 h- B4 J; m% P1 `* A! p" O |