本帖最后由 myskya 于 2019-12-9 11:28 编辑 ) b( A: G% D' Z1 W3 F' h, d
问题描述
. T" D; z& l6 k查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 4 C& W9 R$ ]- q, C( }: s
1.数据去重样例样例数据表 quancheng_test
k! S6 c, h O% v7 {. m4 D0 i
: }( G# n7 c# V功能需求:按 name 进行去重,把 id 查出来。4 ^! v; B/ Y2 `
方案1: - select id from table group by name;
复制代码结果1:
/ ]* o5 n# T7 z4 M* k- v* A& h# ?# j; w
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
0 U$ R' C, l* j" b
6 I# \: l- [. s" Z& V; C, q2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:9 h9 u. d3 c2 f0 b8 R1 W
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
* z7 {% \& V' g) V. x7 Y# S' ]. _ {; k5 M4 K, S5 D& C
distinct 是查询出来以后再把重复的去掉
" I, U% j' P9 O1 k2 M7 c& O性能上 group 比 distinct 要好很多 ' o+ Z8 r7 K6 H9 g
7 e. _% y2 ]' |7 i! } |