本帖最后由 myskya 于 2019-12-9 11:28 编辑
" v( q0 `& Z( N问题描述; W" v% Y* o4 ]3 }3 E# w7 t! p
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
' b: c" I5 ?% [+ u' N: `1.数据去重样例样例数据表 quancheng_test
/ ]# ]4 R g- b- L+ S4 ?
! t+ R# d2 H3 G功能需求:按 name 进行去重,把 id 查出来。
: a! e$ w% F* j) u; y方案1: - select id from table group by name;
复制代码结果1: . J0 E I7 U2 L# s/ S9 G) e
5 y8 x4 F0 V* H# ]
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
' S' J& n, ?+ b2 }4 k. B1 g2 ~" z/ ~+ k$ _; A/ \
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
+ t, R' ^; y1 h' G& ~+ Q ]: W对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: . L+ S/ e+ I& d' W
* K+ F: f& K. U6 \( N9 {* Q
distinct 是查询出来以后再把重复的去掉
/ ]# K1 L6 y! ?! q; A: w8 M" m性能上 group 比 distinct 要好很多 4 u' h" F/ N) M: m* M
$ d' \ Y1 p3 T
|