本帖最后由 myskya 于 2019-12-9 11:28 编辑
2 \) c! q& O# |* z9 y问题描述
/ Y0 ?# Z, k( N% I5 G+ } Q6 P, ?查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
0 X) N6 T' Q! U1.数据去重样例样例数据表 quancheng_test N: C4 A6 C5 j
2 A- o# X+ M L# M# F- [) P% Q4 ^5 t9 n; ?
功能需求:按 name 进行去重,把 id 查出来。8 D1 n8 l6 j9 u
方案1: - select id from table group by name;
复制代码结果1:
# V9 r4 g) Y; d0 o* I" ^4 B
4 N2 d1 d$ t5 u( |+ W6 \方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
: m& e& l( J- A. A Q% I' }: _( r$ }% I# Q" O$ ^/ K
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
6 T* @% x! ]9 r) y4 T对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
. R3 x. D, y! M, F, {9 t9 p0 |; O7 c3 }: A0 F, o n* |
distinct 是查询出来以后再把重复的去掉1 D% \6 v: G! ]
性能上 group 比 distinct 要好很多
# |% r2 G$ j9 X6 i0 y5 W
# v0 Y) M* K* @ |