本帖最后由 myskya 于 2019-12-9 11:28 编辑 + b# y/ t+ M# p9 G
问题描述
# q& v5 W* s( s. U+ K5 J: @查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
# ^- c0 p) ~$ D* A S, n1.数据去重样例样例数据表 quancheng_test - {( H% W; |; V' n' j# S
! `% }6 R; i5 Q8 t/ l; B: v功能需求:按 name 进行去重,把 id 查出来。4 I7 s! b: k9 v7 z" V
方案1: - select id from table group by name;
复制代码结果1: ( Q, b% |( p$ j2 W4 Q/ f; o
- f# @6 S' |2 x) o( N
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: 9 U/ U) Y N/ ^
# ]+ t: A- ?% I* u+ `. w! D! v+ ^# x2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
* O7 a" T0 V6 `8 ]对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
$ a8 N' |* N% ?; J' w
u& K6 }. Z# D/ v/ A2 U+ w3 K( jdistinct 是查询出来以后再把重复的去掉
& W l" E" v M( F9 L" s性能上 group 比 distinct 要好很多 2 k- Y; e! q; K- k) {0 L8 `/ {
) c2 N) w2 [$ K5 Y( K |