本帖最后由 myskya 于 2019-12-9 11:28 编辑
' Y, t6 `/ S* z: X问题描述' [: j% s4 Q( F' s+ P
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
* W w$ ^( i1 _0 y1.数据去重样例样例数据表 quancheng_test ; v' s7 s8 G" a1 t3 @
0 v7 W" a5 h% T4 R) g
功能需求:按 name 进行去重,把 id 查出来。1 b( n1 Y7 n8 a5 m) F; d* y
方案1: - select id from table group by name;
复制代码结果1: ; t7 i& W1 b+ x! Y
7 B i5 N1 U9 W6 O! F7 P! [4 N
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: / z$ K& L% b" O1 y3 C! w
3 V6 D, T s1 O" Z& g( {2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
8 P- Y2 w- I# o8 ]% t# T对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: / ~* t# s# \# O: L" ?6 A5 y
. @6 F, y: H) h6 K; H
distinct 是查询出来以后再把重复的去掉! g" b$ g+ h. Q( E, ?# C3 t8 y
性能上 group 比 distinct 要好很多 ; }8 y1 C# g; s M& x
* ^' ?' y: S/ Y# T$ ~ a' H# [
|