本帖最后由 myskya 于 2019-12-9 11:28 编辑 0 d. j0 u9 `2 I+ G" @
问题描述/ I9 b/ W- ?0 [& _* m
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 $ }6 w& ~( C$ @0 y
1.数据去重样例样例数据表 quancheng_test
$ l$ f! x( e9 t6 v/ v! y
. a9 ]0 _1 Y" [+ B8 C! z& ?" M' h功能需求:按 name 进行去重,把 id 查出来。5 |& B6 p& p$ z* c$ y+ G4 y$ [
方案1: - select id from table group by name;
复制代码结果1:
9 E2 `! G2 K6 }& ^7 `3 x1 V7 u( M* Y8 j- i7 C( }
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
: ^+ ]9 V. ]' }8 `6 C( Z6 y
& R, L8 w+ K. }! J$ S2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
3 v+ q9 S0 r- h' T& d) q5 F对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: & ~2 P7 F7 d" v K3 v4 u0 m5 _
2 L% c5 A' J1 n E; P2 t) j
distinct 是查询出来以后再把重复的去掉
]' m; c* j, Q3 J0 D( Y% l性能上 group 比 distinct 要好很多 + p; H7 g3 b1 x8 u8 K
; I& o& V/ @( M' |
|