本帖最后由 myskya 于 2019-12-9 11:28 编辑 . L c( T2 z8 W; K: k
问题描述$ O) q6 v2 Z4 m4 u$ @
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
* M. Q% f$ a4 ^1.数据去重样例样例数据表 quancheng_test # c: Y" K2 |5 Z1 \. j
" `! ]+ C e7 O% g& G: a+ ~- @功能需求:按 name 进行去重,把 id 查出来。7 ^% W% w6 b8 l5 x
方案1: - select id from table group by name;
复制代码结果1:
1 w: A3 J! m1 Q1 U! t4 H+ ]! _1 U# z# e3 Q/ c
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
. C0 p t& D ]/ r1 c' |
. c. [9 p7 w5 N9 n: N, @2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:$ F$ s3 {7 }+ ^5 R+ Y
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: 6 m+ B5 C/ }/ Y# T
) e& I% p% F0 V9 v; l
distinct 是查询出来以后再把重复的去掉
6 |- I: Y! A& |" W性能上 group 比 distinct 要好很多
( M6 ]6 J% L+ O9 u3 F
, a4 b& ^4 |7 } |