本帖最后由 myskya 于 2019-12-9 11:28 编辑 / x! M8 t" B& q' S& k- X
问题描述
8 J1 n- K: Z1 u+ U1 @' H查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
0 \2 ]! \% B. K* d- b, ?1.数据去重样例样例数据表 quancheng_test
2 V, ~* w$ |. d- x) G O
. z, f8 b9 U) d! L! c功能需求:按 name 进行去重,把 id 查出来。
" n! v' {! ?3 O" c8 }( T* u1 T. q$ X方案1: - select id from table group by name;
复制代码结果1:
$ n5 t/ d4 k$ E1 F. I8 C& w0 y! _" y: S
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: * ^" x# K- T- |7 A3 S- t. n
. t0 o+ |* q) R( m5 t4 @1 w, y2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:0 K" U1 x4 D% o8 F
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: ; m. o J/ g, w
: @6 C }2 A5 l7 x |+ s! H; \, c" Sdistinct 是查询出来以后再把重复的去掉
- Q9 v+ w7 n1 p6 g' x4 G' S性能上 group 比 distinct 要好很多 ' w$ d6 A. n/ C7 U" `* R
* F6 I4 p5 B5 V1 Z3 p |