本帖最后由 myskya 于 2019-12-9 11:28 编辑 5 P4 i+ v6 g2 _5 A
问题描述% s7 f1 B5 Q/ w# d
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 ' G% I) R0 m: k) V2 i# R( U
1.数据去重样例样例数据表 quancheng_test 3 C& o' V' r" ?" D4 V' `+ s% b
/ g- n2 z B4 M- p4 i+ k' V
功能需求:按 name 进行去重,把 id 查出来。- K a# ~# w$ ^4 q: u9 b2 x
方案1: - select id from table group by name;
复制代码结果1:
) F5 D% v/ ?4 _1 a; t+ V* C# I2 Q" z8 ]- Z/ b
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
. {( S/ n, S, a/ f1 l% G' r; m( ]9 _# o- |6 k2 E5 u7 {
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
' L1 h5 m7 G4 o2 o& p3 v对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: R; h6 |" [" I; |
4 T$ M7 m8 F' Q5 y9 Pdistinct 是查询出来以后再把重复的去掉4 W# r/ s* W$ {& m6 p
性能上 group 比 distinct 要好很多
+ i- G9 f/ c+ |. k0 k
- R+ p' [4 g8 | ~7 g7 K |