本帖最后由 myskya 于 2019-12-9 11:28 编辑
- I, U" Z9 S" P1 `问题描述1 ?* j: h0 F1 v w4 A o8 Y6 L
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 4 g6 w' e& {: [9 Z' E0 B) ^# u
1.数据去重样例样例数据表 quancheng_test
9 s# F- ?' N9 m" A- E
3 @+ `2 C) _( m# k" s, D/ x功能需求:按 name 进行去重,把 id 查出来。$ `: c2 V( \' l+ Y- w! z. Z3 s
方案1: - select id from table group by name;
复制代码结果1:
& w" |8 T7 |; M$ B5 d/ {: Q6 ~
- a! X/ H; R) T2 d方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
' P5 x+ Q2 Y, }1 }1 |7 n+ ]& }% ^
& f" o" B; w) P# n) |% [9 S2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
. X, \! l. {8 ^7 \对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: $ R! Z' g$ S* B0 a+ A* Z- `6 u
8 X; Y; |/ A8 B3 H
distinct 是查询出来以后再把重复的去掉
, F |) v3 q+ o& ~/ e6 D) M性能上 group 比 distinct 要好很多
4 p! M1 b9 G" m5 P
k* h" U9 { o* c3 ?! z |