本帖最后由 myskya 于 2019-12-9 11:28 编辑 3 j$ w& I) u# ^
问题描述
, h8 [, T M7 i0 \# s Y查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
6 q2 Q5 m% N; L% m1.数据去重样例样例数据表 quancheng_test
- {$ Y, g5 y- U0 H8 l" D' h0 f3 X4 t9 J
功能需求:按 name 进行去重,把 id 查出来。" {$ ~! t% G( v2 v5 m
方案1: - select id from table group by name;
复制代码结果1: ! X8 g T- E# X
: b1 q7 w$ W( L. n5 v0 `5 Z方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: : i% e& F1 R/ P* a; b, {; u$ Z
, f& k: b" ?5 T2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
* Q0 g; S: q6 l6 `3 W对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: , q8 s# w1 W( Q
8 w! z3 z9 h* B) D* E/ E5 i w
distinct 是查询出来以后再把重复的去掉
. @$ v: x5 d- b% P# u0 m性能上 group 比 distinct 要好很多 2 ^9 K$ [9 d% T K* C I
5 m, G4 t/ q1 ]" Q |