本帖最后由 myskya 于 2019-12-9 11:28 编辑 % D4 P0 x" X8 I# I; Z
问题描述
' U! r2 D8 L% X2 U" N1 ]8 W% d0 {查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 5 ? K" N/ z( D5 o
1.数据去重样例样例数据表 quancheng_test - [3 ?6 N2 k# @0 Q: z! O& f9 W
' @$ x9 V) e1 A功能需求:按 name 进行去重,把 id 查出来。* G1 N A% A. G0 [6 l' M
方案1: - select id from table group by name;
复制代码结果1:
; q7 _9 {: C4 a! v: b* S5 L: X1 g- c! ?9 b
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
2 E" I) K' | K6 \# ^5 T R8 k7 v* X( T
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:- I9 \. b! w. i& M" X
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
( O. D- }8 m, {$ s$ v
/ r7 [7 {! y1 d1 c* b( Q) Kdistinct 是查询出来以后再把重复的去掉
$ v; i7 X+ [) W性能上 group 比 distinct 要好很多 7 |& U' q! V+ r' T; U" y
# x1 c. S: ?4 L K/ X6 _ |