本帖最后由 myskya 于 2019-12-9 11:28 编辑 1 r/ {3 f. c( S! U3 G
问题描述
6 }: [% [# [" k. W; N& o查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 2 a! K1 ?4 o0 d8 g
1.数据去重样例样例数据表 quancheng_test - ?! G2 i: n ~- K8 y
, j; @# R* r% X2 c$ ^
功能需求:按 name 进行去重,把 id 查出来。
. |0 ^7 u3 W" X+ J# L2 ?3 H) e方案1: - select id from table group by name;
复制代码结果1: 1 v5 D" y2 `: |5 u) P. w# O
* i' _, c2 ]( d: O0 h- ?/ B方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
) w- s+ j2 V) u, o" G$ [8 P8 p
+ s+ j% k1 L- p7 }& e, A6 j2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如: ^$ P v( k; c
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
7 i5 o, B; g5 @3 S1 a
3 [& n: j- A7 L ydistinct 是查询出来以后再把重复的去掉
I! Y: p+ Q' B9 C5 t性能上 group 比 distinct 要好很多
- \# f' ~) [8 D$ F+ {$ q# S/ o) i* n1 B) U1 ]
|