本帖最后由 myskya 于 2019-12-9 11:28 编辑
$ i* t d, t' |0 R& A1 W问题描述" p7 V( K, b( Q- z6 J6 }6 I
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
4 Z- D5 ?& Z( ~7 p) ]" E8 j* E$ e8 w1.数据去重样例样例数据表 quancheng_test " V. V' c+ j. ^" R
9 x2 @2 J8 _3 r5 b; R* \
功能需求:按 name 进行去重,把 id 查出来。0 o/ C" A; k! w% P
方案1: - select id from table group by name;
复制代码结果1: ( m6 u. u5 X- m- j ~; v
" c" S5 W7 A; s4 F( W# o) i; }4 B方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: ; s* ]6 D% R2 s( }& v
/ X) {1 ?( Y: f0 ?3 c" L4 [! x
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
3 w* m3 I) D8 ~& s1 X ~( o4 a对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
" m2 o4 m& h9 C
0 p6 L. f" ?& X1 s: [distinct 是查询出来以后再把重复的去掉5 g% J" [- v% I- N B$ N& {
性能上 group 比 distinct 要好很多 * O. X5 g6 X/ P: Q9 @+ f
* N+ |5 i; \3 }0 h& E+ f3 L) W |