本帖最后由 myskya 于 2019-12-9 11:28 编辑
* h+ I# M) D, R2 M' m- A3 l问题描述
2 P0 l3 H- k( {查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
: d: n3 y+ Z' U; `. p9 k1.数据去重样例样例数据表 quancheng_test
9 M6 H+ w& Y0 ?* F7 U- z3 K1 P3 a
功能需求:按 name 进行去重,把 id 查出来。
" `0 G. ?# Y( p方案1: - select id from table group by name;
复制代码结果1:
* b& ~& u4 e& r9 V
2 m9 L- z" D- \3 i) A方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: ; `! j! ~* n8 C: O( A' y
$ ~% s: U$ `6 R5 y# K$ t
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:+ Y7 A8 d: f" W% Y/ `' Z
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: / ] U+ t5 n; E3 w. w
+ M- C% l( W/ q/ j% t: L5 l
distinct 是查询出来以后再把重复的去掉% U( l, t* a8 C) K
性能上 group 比 distinct 要好很多 " m. t$ N. @0 R% A
* W- Z0 |$ [$ Q. o! r+ A |