本帖最后由 myskya 于 2019-12-9 11:28 编辑
9 J# W" j( w% T, h( [问题描述" V. Q6 S8 s) v& t7 Y6 | Z% Q
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 ) n3 Q9 t5 n* K' \' I5 `2 G
1.数据去重样例样例数据表 quancheng_test
; e8 f1 Q {! n& D B
) {( Q' R% w' N( z ]3 b功能需求:按 name 进行去重,把 id 查出来。
T7 v0 Z9 E* w# [- w6 T! n z方案1: - select id from table group by name;
复制代码结果1:
! p, N! l; m* ^& [5 x3 j) }0 p) d; W: `# [3 O+ h* ?
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
" H$ X" m2 w" G: T
6 P. g$ D4 ^7 a8 E* _2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:% L1 z4 a5 J# z0 R' g4 P5 ?, T
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
' y$ N0 g- B9 f
- k2 i+ t1 s7 [; d2 V0 ?distinct 是查询出来以后再把重复的去掉 N( j1 I/ F0 t! ?4 } ]% n4 K/ q
性能上 group 比 distinct 要好很多 0 @( g; s/ ~8 L0 ^( Z/ I0 @
' n) E. z. ~' ]+ |) ^ |