本帖最后由 myskya 于 2019-12-9 11:28 编辑
: l5 `) Q0 o" K2 w9 l3 B! X问题描述, I+ L0 C! T) \! V' Z6 @7 `7 D0 D
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 ! G. h' a' m9 `/ m' R3 b3 s7 _: _; D/ B
1.数据去重样例样例数据表 quancheng_test % |+ L0 s( r7 ^7 E
4 n% m' i0 r/ x& Z
功能需求:按 name 进行去重,把 id 查出来。4 [$ t! z. a! m4 g
方案1: - select id from table group by name;
复制代码结果1:
5 j: T2 x4 f8 N( T3 Y$ y; L; J
, c; l! X& v! N5 _方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
( H1 n! F6 Q+ ]8 @/ o- K; }5 L3 Q* \0 I
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
* P: Z: Q9 w+ f/ g% @对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: ' ?! x/ m( h8 f& N$ x7 E, }
8 a/ h8 d8 D8 n/ `8 a% m9 w5 S
distinct 是查询出来以后再把重复的去掉
! |/ c8 l8 ~' P/ I性能上 group 比 distinct 要好很多
$ h# G- E7 u$ U; L! h4 R( e
9 A2 A+ _" T. ^* w5 U9 e* B$ f |