本帖最后由 myskya 于 2019-12-9 11:28 编辑 ! }7 N- R' f1 ?$ J
问题描述
& k! C5 K- k8 }, V0 W查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
9 c/ T5 |9 p% K5 o1.数据去重样例样例数据表 quancheng_test
+ z. G" O: |" l, v
4 P# k9 m% d0 p' C) T( L功能需求:按 name 进行去重,把 id 查出来。/ K% r( P7 N, z7 b* c3 e& u2 K. {# [
方案1: - select id from table group by name;
复制代码结果1:
* \8 i/ G9 c( e2 M% Y
* ~) f) R- v. }6 z" i方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: 7 K1 w: g/ _; {1 T# x
1 ^ q& _& c. s
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
0 k1 ^* \7 B$ h& z* i7 n对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: 5 O* {# r# P% q t" t
* l7 n% C' F9 H5 f- |distinct 是查询出来以后再把重复的去掉
) n. \' g( i0 R& A) \( G4 n! D性能上 group 比 distinct 要好很多 : W8 t3 Q- Y8 q
. r" ?% M! v% y, Y$ `5 ^" g3 @8 Y
|