本帖最后由 myskya 于 2019-12-9 11:28 编辑 2 n2 W! t. R% x' V
问题描述: t% i' _7 F: w: T& X
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
. R# M9 p* f/ A: P, v9 d1.数据去重样例样例数据表 quancheng_test
- s% B: V: |, c% H+ y; p( b2 w, t- g/ O e
功能需求:按 name 进行去重,把 id 查出来。& j- q* B6 r6 ]3 p9 v- B
方案1: - select id from table group by name;
复制代码结果1:
. U5 n. e. {$ {4 ]- a. q- Z* u7 J7 b3 H$ c
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: / t' v9 ]% c' J! n5 h
/ g. L# M" Z" B
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
" J/ ~- p+ S5 T4 Y* `/ ~对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
. {, H/ g5 C% J8 a {
, r1 k" U' ^4 g! L2 z" vdistinct 是查询出来以后再把重复的去掉
1 g, D, K) O3 g: o- R5 N性能上 group 比 distinct 要好很多 m4 a! W( T% k
- ]% u, L7 L2 X/ p |