本帖最后由 myskya 于 2019-12-9 11:28 编辑 + r5 e- X6 B" T6 O0 q' P# e
问题描述
+ M: y4 P+ J- X$ \' M* f查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
3 j7 t! q# w2 v1.数据去重样例样例数据表 quancheng_test 5 Y& @& w& q, z! R
- J5 v+ D; n5 p功能需求:按 name 进行去重,把 id 查出来。9 q2 A) W# p; Z& e% U: J# a
方案1: - select id from table group by name;
复制代码结果1: 2 G. v9 D$ i% j. |
3 n3 \' f1 b+ T6 l
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: + w7 y/ s; `0 w* w/ ?$ A8 L
% Z1 T& N" X7 C% t) N! J# u" U2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:8 b$ l& J1 V5 l. J0 U+ E
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: & J! b' n+ S/ e* k2 x
6 z$ A) B; h+ P, |distinct 是查询出来以后再把重复的去掉
( S) x0 b3 o6 P6 e9 m' U! e性能上 group 比 distinct 要好很多 ) l5 `# J# t0 V! ?9 N2 U8 b0 @
2 _0 h4 V. K' J4 l B
|