本帖最后由 myskya 于 2019-12-9 11:28 编辑
; E1 w& c0 R1 u& T+ T/ q. Q: O问题描述
( b. K/ U2 m7 `查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 2 _6 v( t7 g; \
1.数据去重样例样例数据表 quancheng_test ' w6 h# `8 o/ Y4 E! x. S
& J5 ^6 a, }: w7 k, J
功能需求:按 name 进行去重,把 id 查出来。
0 j5 L' x' l) c3 \0 s方案1: - select id from table group by name;
复制代码结果1: ! v( G, M/ ?, Z, v
+ d, o# s$ D" L( C9 X4 Y方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
! g! c) p8 ] m8 Y6 k, `
% m5 H2 X8 a5 M4 _) c2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
8 T s' G3 {3 a# Z) N对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
; F) w5 C7 n8 I2 O( Y$ E) c! }- M- o5 F8 U: _. c
distinct 是查询出来以后再把重复的去掉/ r- Z) s8 T" }& r3 n2 c+ T" Y
性能上 group 比 distinct 要好很多
* a% r; }$ ^, O& ?& b( _4 B/ a; |
1 x+ J T( P, a2 W& B' x |