本帖最后由 myskya 于 2019-12-9 11:28 编辑
j6 O! K7 @$ _7 Y; j问题描述! h: ^ e$ |5 t/ C. N2 K6 s" _
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
0 R$ X: o/ I: N- E* _$ g7 W- z1.数据去重样例样例数据表 quancheng_test
1 b; {9 P6 e4 V- X& L0 k' E2 n0 |6 r
$ l! x" c# z: A% \2 h+ J功能需求:按 name 进行去重,把 id 查出来。& \" a, {, ^1 I D" k) E
方案1: - select id from table group by name;
复制代码结果1:
: A6 n( u4 ]. o8 y r- `
, r" v9 P, Y9 f* r- n6 G方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
3 S) X" S* f( {8 m2 s; H
+ \* _7 U% j; E M% _2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:' V+ y0 Z& u' H5 [
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: 2 K# E& X# R9 a
$ K, v5 f, B* P. D% Bdistinct 是查询出来以后再把重复的去掉4 Z& B6 a+ X2 r' ^1 K- y
性能上 group 比 distinct 要好很多
3 B& B1 v6 f% k2 v+ \
9 P" D2 Z0 e$ Z4 N {8 u. f |