本帖最后由 myskya 于 2019-12-9 11:28 编辑
! ]+ s, m! @# R问题描述& w0 b. U6 Y2 o- p+ d5 R
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 ; u7 i* C' h( d! P
1.数据去重样例样例数据表 quancheng_test
/ ^( \# c( M5 a! u. Z' c
% w4 B8 q8 i) E! N1 O功能需求:按 name 进行去重,把 id 查出来。
K; L3 d; z" r/ E* F( e2 x方案1: - select id from table group by name;
复制代码结果1:
* @) c2 J8 C( P6 T: @* z% t/ V/ Q) {3 T8 L8 a
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: ! Y9 C3 z7 g+ |6 c1 [ z
& [9 T: e9 X/ U$ ?" r2 d8 Q8 w
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:7 r4 G: x; O2 z5 ^1 E. W% o# f
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
* g) Z# j1 a- Y0 o8 M
: V* C, n5 ~; m1 z" e6 O7 A# odistinct 是查询出来以后再把重复的去掉
" h9 ~" X: K; I/ C: m6 f性能上 group 比 distinct 要好很多
$ a) N" a, u" E
* D% Y* [# F4 J2 ] |