本帖最后由 myskya 于 2019-12-9 11:28 编辑 9 R, l4 ?8 J) u$ d5 x* G9 P. O
问题描述( S/ h$ u4 w' c6 P
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
* y7 p2 r: N& V# \1.数据去重样例样例数据表 quancheng_test
! i5 C0 |. g# T; C1 u, k1 z/ |% @/ r% [( F
功能需求:按 name 进行去重,把 id 查出来。+ u* o7 b, E! ^0 c/ g$ \
方案1: - select id from table group by name;
复制代码结果1:
. m( H o5 P" _" s
6 A# C# k+ @$ k1 B方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: 4 q& G! i+ Z0 O0 e
: v3 h) P0 S, B0 D; B1 f, m( q7 l
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
6 k: a/ g1 ]; d' j5 ~对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
+ r0 O, Y& H" m7 g' N4 m( L( p. _. n! c' S* E5 Q' N7 j) q' ~
distinct 是查询出来以后再把重复的去掉
0 G) m' p/ b. i# D5 `! y. i* U性能上 group 比 distinct 要好很多
2 l# d* l1 o+ f- V5 U/ W6 w: [5 v) b) v" u3 F* _7 {+ _3 ^- S
|