本帖最后由 myskya 于 2019-12-9 11:28 编辑
$ T# \4 D4 Q% g" v1 q' H5 F问题描述2 l, e5 l& F. S: _0 W$ L% ^9 E
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 & }( I4 n1 H5 w
1.数据去重样例样例数据表 quancheng_test
5 w6 F. Z. N- q
3 @+ I( ]; K4 n3 s功能需求:按 name 进行去重,把 id 查出来。
1 ?7 H$ c8 x3 \" D方案1: - select id from table group by name;
复制代码结果1: % ? r6 l- l/ ^
7 y! A" `! a2 {) X$ O# ]
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
$ u% p" {. j2 `& b8 d
5 D% I1 y3 m. y2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:; F% J4 U; L9 q$ k( [4 \
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
* C$ N8 |# G7 R5 \& c: K9 A% J
3 P9 Q: b( S* f, {- I9 R7 O$ Pdistinct 是查询出来以后再把重复的去掉% ^2 u# q5 `( O8 Q3 n3 K
性能上 group 比 distinct 要好很多 " r6 z3 Q5 R, Q0 y# E# y- D
- H( I, K2 I9 ]* L S, b |