本帖最后由 myskya 于 2019-12-9 11:28 编辑
2 D: t$ y3 ^8 `. B9 `7 g1 f7 N问题描述
6 e" k& ] _: E% q- T查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
+ L# U* i. e" i5 L: d1.数据去重样例样例数据表 quancheng_test 7 r. |6 M( T9 q2 T; n
. N8 `% t r% X功能需求:按 name 进行去重,把 id 查出来。
3 X- `8 Z, V5 f0 c8 ]方案1: - select id from table group by name;
复制代码结果1:
! s& t0 m4 `7 \2 a6 Y! z% V/ Z# m0 M: V7 v* W! R9 g" Z- i
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
/ ~, G- P c$ z7 e( h# k0 Q1 _2 T3 x
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
8 y! S7 r! j8 p0 L对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
/ N5 g% U5 L" X' K" V: g2 S: `* M8 y4 v# [
distinct 是查询出来以后再把重复的去掉
9 y( S( n% a) W6 ^3 |. W* v性能上 group 比 distinct 要好很多
) o1 D: _2 T) t/ Q" \' Z- y" x, M/ T/ O; q
|