本帖最后由 myskya 于 2019-12-9 11:28 编辑
3 R4 a9 F; u8 D H; m: ~# W问题描述
+ A2 V- z2 L0 I5 Y* v( t) P查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 4 y' c% Z; U( C
1.数据去重样例样例数据表 quancheng_test 3 |8 `1 B" t& j. ^3 n) x( |
$ E8 U. I ?9 d& ^
功能需求:按 name 进行去重,把 id 查出来。
6 y% [3 L6 _% g0 `方案1: - select id from table group by name;
复制代码结果1: # {- @1 l' T* J# `5 Z; q
: e' `$ {6 \! S' Q2 I4 i
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: / J W+ \. Q6 g% V) G2 P4 V
6 q o7 o) M* U2 e2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
2 C7 Z/ ]& e! N) F& ]对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: + S) Y$ r: W: _6 |% `- S
9 ~: s9 y6 G1 o( C" pdistinct 是查询出来以后再把重复的去掉; ~4 q" C3 V& f; j3 T, g
性能上 group 比 distinct 要好很多
9 @( P: S$ `5 V- X a: X8 H( ]( \: K' A
|