本帖最后由 myskya 于 2019-12-9 11:28 编辑 6 R8 g6 b0 E; e2 m( W
问题描述* ?" V% s% n9 o6 ?( \9 [
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
4 q$ m8 n8 B: D; A1.数据去重样例样例数据表 quancheng_test : r9 ^4 @( n' N" d
0 N4 s/ l& R; }- P! M3 V
功能需求:按 name 进行去重,把 id 查出来。
. ^1 h3 q- a- g% h6 S G( @" c; a( V4 ^5 y方案1: - select id from table group by name;
复制代码结果1:
4 [7 w/ F j( ^/ v0 K5 U- `& L* }9 W F
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
" n- r9 R' C- p; t& B1 G* L' H4 z$ j7 x( {3 m q9 m1 m7 z# G! N
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:! ~! G1 b3 D3 q: F8 k" L+ w
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
" f- O! K+ U1 Y# j7 e
" y) F0 P6 T/ t- r9 r# j. H( Sdistinct 是查询出来以后再把重复的去掉
7 H5 @8 V% s( _( `2 Z9 S6 N* Z性能上 group 比 distinct 要好很多 " k8 z; e# ^ d
7 R1 \5 v" z( f U: }/ M5 Q
|