本帖最后由 myskya 于 2019-12-9 11:28 编辑
5 \ p% h+ E* z) F* `问题描述
5 ~$ B! ?# B" I: Q! `, P查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
7 {+ F3 e- Z A4 N/ ?! S& l1.数据去重样例样例数据表 quancheng_test
; _; N ~6 J2 \2 y1 f/ V" x# s; \3 J+ M
功能需求:按 name 进行去重,把 id 查出来。+ _; c/ ]- q0 R; R/ r, [
方案1: - select id from table group by name;
复制代码结果1: ! ?# H! ?' h5 F6 k, E
4 j7 |; T3 i9 W8 H* y
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: 6 N$ j- r% W9 A8 c) V6 ^
+ J- j# G: `+ D+ S/ F- z# C
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
9 G9 C/ t: C5 N对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: 0 g9 K @( c# `# d2 @
X( E2 ?( G! T: B6 e$ g K
distinct 是查询出来以后再把重复的去掉# C$ y1 b, j' {0 d9 X
性能上 group 比 distinct 要好很多 # N4 f. O. H/ j- e4 t
2 p$ J% u2 e; n
|