本帖最后由 myskya 于 2019-12-9 11:28 编辑
2 Z; m: h8 l) h$ O问题描述) s: W/ H& n4 r) e [+ h" y7 F
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
1 g2 m* |, F, V0 k& J8 @( C$ a1.数据去重样例样例数据表 quancheng_test
( ~5 b) M/ e9 l6 m. u5 [* z ]7 n
# U4 Q* `3 j0 e功能需求:按 name 进行去重,把 id 查出来。
' S% {9 V( u* i. C+ n方案1: - select id from table group by name;
复制代码结果1: ; l9 c. @8 H( d# x2 I5 L7 I
) Q2 u! ^# E+ s方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: # L& W: C; p: H: \
y6 K ^' Y. Y1 d4 { v& q
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:6 B8 I5 l8 ^$ H J5 Z# n
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: 3 k3 g" J$ b/ B: U
! j8 d h+ }$ y. Zdistinct 是查询出来以后再把重复的去掉$ l. `' }* I% H/ t; q) q: P; ~" p
性能上 group 比 distinct 要好很多 * O4 j M3 K, v- d
! [* v4 Q0 d) s7 S1 t6 ]7 z
|