本帖最后由 myskya 于 2019-12-9 11:28 编辑 / M' o* H& s# k7 b7 L- C( t" P! h
问题描述4 x- G/ O3 |% r% q
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
9 [ D' h9 C1 a9 B3 h1.数据去重样例样例数据表 quancheng_test
& Y, F. W3 L! h t* l9 G. h9 h( i2 l. E* |1 H9 c1 r
功能需求:按 name 进行去重,把 id 查出来。
0 l- G- |7 z S; T方案1: - select id from table group by name;
复制代码结果1:
3 [2 e n8 D/ S! M( a( _& O% I- f/ Y4 [; P* _* g, D
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: " O/ {" l* B& Q, k. b9 T6 Y
4 _% e# H0 S0 F+ B7 g: d2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:/ o# J6 Y r# j! _% [
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
6 L( T0 U0 b- u' k& X: T4 L. Z5 T: K7 r+ K! Y" N5 o! u
distinct 是查询出来以后再把重复的去掉
" w" `, z u) t0 ~$ k6 g9 s/ I! R+ m性能上 group 比 distinct 要好很多
" f/ Z" } R. |! c3 b8 \! C3 b
9 c ]' n6 x% j2 k |