本帖最后由 myskya 于 2019-12-9 11:28 编辑 1 f( [/ j7 m4 t
问题描述
' A" N- }, I# F6 U; V# V: c查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
& ~8 l4 y9 Q7 x% E1.数据去重样例样例数据表 quancheng_test 3 q9 r) \; R, T2 ?& d) i( c
9 Y/ H1 ]4 a" s: b4 l0 |: C
功能需求:按 name 进行去重,把 id 查出来。
0 B- w" F( B, q% {方案1: - select id from table group by name;
复制代码结果1: $ W& h0 x8 L! ]9 v
3 @! W% `0 \: {' @& k" Y) p
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
/ s* a: ]. D4 }, J. {' Y
4 ^1 ?, W4 l1 a: b3 P" |: Y( i2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:: n6 y' r& Q' Q# N5 I4 Z: j- _
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
. F) M/ d0 K$ |" \; u% \" [: e E* H% F" m8 h! I9 e/ {) M
distinct 是查询出来以后再把重复的去掉. @) t8 B; |) s2 `. V: b6 u0 a! k; P
性能上 group 比 distinct 要好很多
1 p: v' _7 X& v- K- W8 @2 ]- t# z$ r$ f/ Y, a
|