本帖最后由 myskya 于 2019-12-9 11:28 编辑
- X# u- r) j& C* M- y( [/ c6 l$ ^问题描述
7 n3 @3 X, Z" \查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 " f+ g/ J) y" n5 a4 D
1.数据去重样例样例数据表 quancheng_test : \# a* o9 R2 G; h' u. H
3 _8 W7 j, t4 {- \功能需求:按 name 进行去重,把 id 查出来。
1 k. z9 t+ V3 s4 T$ v方案1: - select id from table group by name;
复制代码结果1:
7 D, _, g3 z0 h" X. ]3 H& y9 u, d' G9 L. p6 ]% w, ~' C
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: # R% S1 _) W5 [. I8 n
# }* G* P2 {3 k0 I# t9 {. n) E
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
' ~7 y- B$ k7 S# t2 r$ ^4 k" Q对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: d3 e4 c0 ]- R% b4 J" G
# _: L% B7 I" D: Z+ b! b
distinct 是查询出来以后再把重复的去掉2 Q' i* `/ o* H# P5 |8 ?
性能上 group 比 distinct 要好很多 - l. e3 ?. {' f5 F% D; s
! c. ?+ n, ~9 D. r" }) Z' G
|