本帖最后由 myskya 于 2019-12-9 11:28 编辑 & t$ ]6 r" h6 q+ n8 w' ~
问题描述
# w# T0 l& ]" g8 |- y查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
3 f1 W$ t" x8 `0 @6 r1.数据去重样例样例数据表 quancheng_test + q! Q) G) `5 I; S3 j! f9 l
" K" Y% u1 d( Z: p1 N' O4 F
功能需求:按 name 进行去重,把 id 查出来。
3 O/ S: E: }3 i" |* t( G方案1: - select id from table group by name;
复制代码结果1:
# o2 ]! B: }* E8 e5 z; _( Y1 ~1 m2 |" J7 x5 J) p+ q
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: 3 T+ g, ` Q1 s/ q. h
% T/ w. y& b5 r4 v
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
! k2 q: b5 o) a: Z2 ~# F对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
6 y7 f. v/ W9 a: e$ P5 D% `
9 D3 ^/ v! B+ H! T4 Zdistinct 是查询出来以后再把重复的去掉7 q+ _; N8 M, ~8 q
性能上 group 比 distinct 要好很多 0 i& ?2 {! \3 g/ k0 |
2 m" o6 z. d. A& Z/ D0 r, k: A |