本帖最后由 myskya 于 2019-12-9 11:28 编辑
- [" n: l2 B# M, [0 r问题描述
& L* B/ `6 z# T6 M# z查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 4 `) E: W% U% O/ a" c2 n
1.数据去重样例样例数据表 quancheng_test * T% ]( h! J4 R
% L2 Y8 [4 O* ^4 z/ ~" k功能需求:按 name 进行去重,把 id 查出来。
* K# ^! @6 k* k* e方案1: - select id from table group by name;
复制代码结果1:
- d( V i$ h7 h1 S' J
6 l0 D8 U$ \: L5 X. d, R! |6 q方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: 1 j3 V9 Y" o) g6 e* ?. F2 h, D
/ Z- R4 j: n. J4 g+ o
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
- y3 p; [/ X! s6 g对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
' o5 ?0 T+ b* ~8 o: m8 K5 x& W' Q0 S2 L
distinct 是查询出来以后再把重复的去掉9 ^. p" B$ k( I
性能上 group 比 distinct 要好很多 : G( t. j$ J. F
; m# j( n5 r3 g, s3 ?5 k, Q. U5 w
|