本帖最后由 myskya 于 2019-12-9 11:28 编辑
/ J! q3 r, m h* U$ _+ E1 V5 \3 ?问题描述+ @, b! Q4 p9 V: c3 L
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
. r; g( ]5 l3 B0 T1.数据去重样例样例数据表 quancheng_test 5 L5 F! n) g) N N2 l& w
, @3 R) a/ R6 l! q* l- w T+ r功能需求:按 name 进行去重,把 id 查出来。
* Q3 O1 Q9 O& ]# z4 ~方案1: - select id from table group by name;
复制代码结果1:
) f6 M8 \# j6 y# u) C& z
8 V2 n/ R3 ~( A0 I9 q6 D方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
( _. e1 I- l$ \6 s$ I% I3 y
& {* K) p7 R& i( ~/ t3 G( ]% X2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
3 }. P1 Q7 j: E) c3 ]4 O/ _! |对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
- h: d) w8 J& k _1 l9 v. W; R
distinct 是查询出来以后再把重复的去掉- f: a( x; w o$ [; P+ u& t
性能上 group 比 distinct 要好很多 & o) x. B8 t; ^2 w
+ X" F5 @2 t+ z( o# w4 F* W, \# ~ |