本帖最后由 myskya 于 2019-12-9 11:28 编辑 " C* T% q' D: g! r& C6 ^% h) Z
问题描述
' U! Y w" }, k+ m; l查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 ) u: Z! |/ X4 N! b3 v3 R
1.数据去重样例样例数据表 quancheng_test 7 d. @6 {$ ?) `6 n% P6 q2 a" n
/ `) H8 x, q2 z
功能需求:按 name 进行去重,把 id 查出来。
3 w8 F2 O6 Z; U! g" ?. W6 X方案1: - select id from table group by name;
复制代码结果1:
0 A/ E; @& r' |( c$ z+ `/ B8 v6 o1 y8 C5 F0 f' J
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
1 b1 c' e' {5 Q& @0 r$ z8 t) ~1 n; i9 C+ s' G. g. l3 d0 A
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
- M- t3 C% D. u, c% S, K' ^对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
2 ?6 r9 B1 y: W/ `8 W! S) f2 \9 o" d: S+ i
distinct 是查询出来以后再把重复的去掉4 P: J) Z! N, w7 W1 W/ \2 s
性能上 group 比 distinct 要好很多
4 u- X0 `5 K9 Y' e# w0 v, ?2 [+ e7 m/ J( {: d' }, b7 Q
|