本帖最后由 myskya 于 2019-12-9 11:28 编辑
' B0 [& |, F: h问题描述
) f* s) g; a! o& ^" J% X+ w' |& \查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
2 u/ o. \/ w3 c1.数据去重样例样例数据表 quancheng_test
: u" U5 d# T4 [6 P2 o8 ^3 {6 ^5 J7 f3 u
功能需求:按 name 进行去重,把 id 查出来。6 u" |# m1 d& v+ ]
方案1: - select id from table group by name;
复制代码结果1:
& B, [1 w2 l5 e# f0 O* f7 p: @
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: , ?# j+ M9 O+ v# F F1 m
3 J9 I3 X2 I! q% g
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
* ?! w- B d' I( P& l对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
0 X# Z: C2 e4 a6 k3 ?
/ N/ s9 o7 R& R8 edistinct 是查询出来以后再把重复的去掉# s) z. F, u8 D* v/ G: h
性能上 group 比 distinct 要好很多 % c5 ~8 j+ ^6 n" |3 V
0 N* u+ [9 o5 K- s1 `
|