本帖最后由 myskya 于 2019-12-9 11:28 编辑 - M0 T z5 r2 J- _# r, |, B5 Y8 m! X
问题描述
* P* T) `1 I! i查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 / d: x- g* Q4 b4 ?$ S% T: n) c
1.数据去重样例样例数据表 quancheng_test
2 V: \) z# m; \! Y" q' u6 L0 R& I8 W0 z/ x) x# e
功能需求:按 name 进行去重,把 id 查出来。
; I* ~) R6 p. H# R& B. L方案1: - select id from table group by name;
复制代码结果1: ' E5 U7 X; n* R& p
5 ?1 I0 n. k# c* }. P方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
! g% U- y' Z* L1 w
2 a) ]: U, C4 d) k# R+ `- Y# {2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
$ m: Z% _( B4 W) W7 R对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
F/ e3 V& i8 T1 E3 U
) j3 z0 }. s+ c/ H4 z+ n4 sdistinct 是查询出来以后再把重复的去掉
7 o! q" K" }, V) ? J8 u性能上 group 比 distinct 要好很多
3 b4 J+ Z* j2 f( q) t0 C; |! g; \4 }6 s* t& j: o, D8 y' ]/ p
|