本帖最后由 myskya 于 2019-12-9 11:28 编辑 1 o. b, n9 |% g1 k, R/ G& w
问题描述( t \! K* W& L1 l( r' F/ o9 o
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 6 A; `% b/ @6 l! |/ B
1.数据去重样例样例数据表 quancheng_test
$ A" T2 {/ Z5 A6 f5 Z0 D* { H1 j7 | D6 C, l4 A; w6 ~
功能需求:按 name 进行去重,把 id 查出来。$ G8 s4 x+ z1 J- z0 d
方案1: - select id from table group by name;
复制代码结果1: ' u9 g( V& `7 W0 A
[+ J! J; r* @* b3 P/ v K
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: ' y' P) ]5 J' ~; ^
9 J( v0 S* h- w1 {7 \+ L7 `4 F0 k
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
; S6 ~+ q! s) o. b( d M对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
" \8 z& `' d8 V% v8 T6 X9 b$ l6 w% @, v, ~% l
distinct 是查询出来以后再把重复的去掉( i1 j( V- ?9 a: t5 C5 \
性能上 group 比 distinct 要好很多 # A' y/ v% m2 [7 a" d/ @4 l9 M
$ K/ `- q1 w; i. d. v7 {. I |