本帖最后由 myskya 于 2019-12-9 11:28 编辑 " L! [7 _4 Y) M6 \
问题描述
% ?0 x0 I& o- w4 s. Z查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 ' P+ a3 n- C; Z1 [
1.数据去重样例样例数据表 quancheng_test
- d: d0 k. N( C) G) b4 m) O
- i" H4 I4 X+ N9 C功能需求:按 name 进行去重,把 id 查出来。3 H& a9 A8 j7 A+ G" I
方案1: - select id from table group by name;
复制代码结果1: 5 N& e5 A* h* M9 _2 e w
9 S: H. y1 `1 p. e方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
3 e5 H) e' K1 D9 d! Z3 t
8 K/ F4 N( q2 ]) j7 u% @2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:: L1 d2 O- u2 @ T2 C) ]
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: & j: l7 g H8 N; p$ s
2 n, J. j2 X* _0 J7 D+ @2 B5 r Ddistinct 是查询出来以后再把重复的去掉
, j8 U" N0 {) m3 O' c0 l9 q2 V性能上 group 比 distinct 要好很多 / |4 m: d! P' ?4 M. t; X) M: c
0 k) J) H: M6 [# p& h
|