本帖最后由 myskya 于 2019-12-9 11:28 编辑
9 W0 ^1 v0 F+ e' k$ W- E& g9 f- z问题描述- i; i; ]' I. M* r" I& H' q
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 4 e2 n- p5 u1 y! k* A
1.数据去重样例样例数据表 quancheng_test
4 J6 u1 Z" ^; c) `" X- Q/ q3 C; v C4 o9 o9 ]
功能需求:按 name 进行去重,把 id 查出来。
J4 m2 o3 r2 B2 {. }6 l方案1: - select id from table group by name;
复制代码结果1: : \$ g6 l" V6 ?- l2 D8 c- A8 f6 K$ V
# z8 J! H0 y. ?' g. `/ t方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
" F0 Q) q `% R2 T5 s# T+ e ~ z# u/ V
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
& Z8 {# U, |4 m对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
. t; {& S" \3 B4 h; ~) B# `
# S# {- _ f; A7 n, udistinct 是查询出来以后再把重复的去掉( A2 U0 b4 l: G7 Y5 A
性能上 group 比 distinct 要好很多
+ D# ?+ u3 z$ g% A
; P3 i; ]& y3 n5 k* l |