本帖最后由 myskya 于 2019-12-9 11:28 编辑
' l. j9 U) `: V; I; c$ h; {' K问题描述! Y" k1 R, D/ y [; M
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
' D0 w# y) A) L1.数据去重样例样例数据表 quancheng_test 4 ^/ Y: {! K4 _( Q: r$ I" ?7 O- Q
1 z9 m0 B P. C) p! B
功能需求:按 name 进行去重,把 id 查出来。
2 I9 g5 o, b. y8 [方案1: - select id from table group by name;
复制代码结果1: # B5 i- D: i4 e
, P- ^% j9 K2 q3 `
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: ' @4 X, U7 A% D+ q2 W) `; L# K
2 V6 y& Y5 p4 b7 f% |$ Q
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
1 o4 r; g2 Q. A* J' N% K; ~' Z对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: 1 z5 K2 p$ V+ o2 G9 I3 O" c6 U
' k( u, Y' h9 tdistinct 是查询出来以后再把重复的去掉/ @- X3 T7 W- Z% R; k3 X
性能上 group 比 distinct 要好很多
7 f+ S* g3 a7 X1 v) [8 S; H
1 [; K- p# p5 _ |