本帖最后由 myskya 于 2019-12-9 11:28 编辑
- d# m2 G1 y! E5 Z& T( A问题描述
( B- M5 Z7 ^" x$ w5 O8 e查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 $ ~2 d* |( `, ?0 f
1.数据去重样例样例数据表 quancheng_test # g* c- ]% y" w7 `' t
+ X% V+ B/ f2 E0 C: W: p7 L功能需求:按 name 进行去重,把 id 查出来。, D1 \* V& W( P
方案1: - select id from table group by name;
复制代码结果1:
0 Y7 N1 V# g, {# S7 b* B" `, b
8 `. p9 f, u9 U I. r, Q方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
/ Q/ r7 K( e9 \9 _9 D. d
$ ?7 R+ q+ M/ r8 a% ~" E5 l( {6 w2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
$ }8 ?/ R: T* z7 n对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: ) M- ~2 `, }5 t: b7 d N
) K: L. @, [$ {3 a1 gdistinct 是查询出来以后再把重复的去掉8 I7 u& ]7 o0 k9 t# \
性能上 group 比 distinct 要好很多 5 u) P) E! p% H& o# n0 `8 D
1 l. E7 E5 }6 |! V( l) i" F
|