本帖最后由 myskya 于 2019-12-9 11:28 编辑
. q/ R/ }- M& s0 G1 V) w问题描述
4 o8 b! t( g7 B+ n5 y7 i5 `) y( C; P% N查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
7 z2 f9 g% l# u7 \$ r o/ K1.数据去重样例样例数据表 quancheng_test
- ^3 R/ W9 j+ ~, L h* h1 c h, i* V- s. o
功能需求:按 name 进行去重,把 id 查出来。
4 ^) H J' a: Y% W方案1: - select id from table group by name;
复制代码结果1:
$ k5 ^. _* ]- v# T+ m
/ O& M0 [3 c3 v8 b方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: : z/ Y( f* y ]) r$ f) t, A+ [
+ z( x" v; F7 H4 q Z; S: x
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
, t8 f' Y) H4 m对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: 2 s5 u( | ?: l* C e$ ]% z
- k' [% q) W) j4 v# r y$ @
distinct 是查询出来以后再把重复的去掉) B* C. ]+ k" z c: m0 v& C
性能上 group 比 distinct 要好很多
8 a& K Z" L# f7 Z4 @$ l( m) g, Q3 e! L
|