本帖最后由 myskya 于 2019-12-9 11:28 编辑 : i3 \- Z7 p; c. m/ @" N- R8 h
问题描述
: b1 K# y$ K( `- r( p% w1 z查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 2 R- H1 g$ I7 O9 o+ g
1.数据去重样例样例数据表 quancheng_test # L4 ?7 k4 Y3 S8 S
7 T- I# [8 }0 `+ S7 ^
功能需求:按 name 进行去重,把 id 查出来。
/ N4 R) A: l |# G方案1: - select id from table group by name;
复制代码结果1:
! j, [: Y, i4 [% [
8 v2 h7 v+ X& j& Y) s方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: 1 A0 j& C0 K2 J
1 t7 j$ B* M: `! f2 ?3 ~
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:! d) I. ?- z! _6 l( G, M/ b0 `
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: , p) L7 z* _% K" {
6 t$ O3 s2 ^9 tdistinct 是查询出来以后再把重复的去掉; D- b" u7 A5 z
性能上 group 比 distinct 要好很多
% c1 [0 Z4 ^% q" C
5 {+ A$ ]5 Y& u |