本帖最后由 myskya 于 2019-12-9 11:28 编辑
( q- y# b0 M6 B* P% U. r2 m4 Q问题描述! e$ \1 e" F/ z/ l7 B$ k9 s
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 , y- |2 p$ ~7 L( `5 V
1.数据去重样例样例数据表 quancheng_test
; ^8 _6 p2 J. ^+ g, m7 \
4 ]7 g$ B6 U6 r1 @# ~# }功能需求:按 name 进行去重,把 id 查出来。9 W! K3 z, {3 E' e0 W; J" Y
方案1: - select id from table group by name;
复制代码结果1:
, U9 h, b; E5 v7 T) j+ }$ U- r$ W, Z: W
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: : S/ H9 x' O4 h" D/ c/ u
! A( F* y# e8 I2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
; ]; h6 o( a+ ^' |- }8 S3 k% B: w0 h* m对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
: K& c# D# Z5 K
- [. ~; d2 k6 i) d! P; a) Wdistinct 是查询出来以后再把重复的去掉# ^& N2 _* Q) o7 `$ {- r
性能上 group 比 distinct 要好很多
, X. ~- [, Q6 `8 {4 H. ?# O9 ]. T# V' w+ s* }
|