本帖最后由 myskya 于 2019-12-9 11:28 编辑
8 L" j3 Z* H$ D6 p0 K问题描述
( [& y5 N" w+ ^' K$ X3 `% b: a查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
$ V. `* @1 u. @2 @' f' H* c1.数据去重样例样例数据表 quancheng_test ( d4 T t$ p$ p, c
; t2 f6 x: U/ Y6 \9 n7 C
功能需求:按 name 进行去重,把 id 查出来。
& ^9 C% z. g* i: k% g$ M) p0 k方案1: - select id from table group by name;
复制代码结果1: * k* i$ x# K5 E- r# u; D- N5 Q9 S
. H9 o- N9 ?8 Z# O方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
; |6 S" Y! y [3 |! U, O" T. [% R% g* z8 q+ {7 Y: T
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
( _: h) R6 V( r对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: ! i% e7 z/ T* u1 C# m- a
) m4 Y/ d/ n0 \2 K0 H
distinct 是查询出来以后再把重复的去掉7 B& s& m: v/ M1 |
性能上 group 比 distinct 要好很多 7 V( S) u/ z) v, r! U9 ?
& N$ ?( w/ C C$ [1 J |