本帖最后由 myskya 于 2019-12-9 11:28 编辑 3 @4 p" P9 J: H+ [1 O; D+ j, l7 c
问题描述% N( a( [9 \. ~ k& V: W& d
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 / Y7 J7 }. j5 w7 O6 F3 ~, O; i
1.数据去重样例样例数据表 quancheng_test
4 @$ O! w# e( {& U# s: g* ~( s) ]; z& j
功能需求:按 name 进行去重,把 id 查出来。" l; A) g, Z: c' f) f
方案1: - select id from table group by name;
复制代码结果1: & M& E7 ?% h5 o+ E' Q
% s1 k M* Q; w6 o3 k0 ~& ?方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: 3 d+ n& t. W- j" @# z) b% X( `" k
1 F5 b# `; x* K/ N0 y8 w
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:/ |9 K6 q7 E9 T6 |- G
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
1 x4 S* A; ]) c1 S/ _) z8 j' J! G8 n% d6 X/ t4 C% N
distinct 是查询出来以后再把重复的去掉: p% L0 D1 f1 m/ ~
性能上 group 比 distinct 要好很多 8 L8 X! N7 X# H T; z3 w5 n
* b8 v0 ] i% T8 ]5 S: v& a6 v9 f |