本帖最后由 myskya 于 2019-12-9 11:28 编辑 ( u, Y- `. u( K5 g$ q
问题描述3 ~" e& V) g" z+ V, C, @
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 / g" g8 u% p2 ?2 k
1.数据去重样例样例数据表 quancheng_test * a( ^0 T! X9 g. z! h+ Z; n
: L5 F$ R2 z& S9 @/ ]' f! g- _5 T
功能需求:按 name 进行去重,把 id 查出来。' M9 r, ^% R4 ~# X
方案1: - select id from table group by name;
复制代码结果1: . x' u6 a, x: x
: r3 I& Z; d* ~0 c+ K. B
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
- g/ P' {: ?" P' V
" Z* L; H, H% S+ [ j# L2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
4 d+ B4 j8 k. e对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: ! \& t& {( `: O8 x+ p: Z$ B; X
/ D: n' `4 r2 b$ |/ \8 N
distinct 是查询出来以后再把重复的去掉* [% @! x. z9 T4 J
性能上 group 比 distinct 要好很多
# v$ p+ {% W0 Q2 `7 d% S% W0 \7 \0 u' |0 I z8 P0 k; s) u* Y% R
|