本帖最后由 myskya 于 2019-12-9 11:28 编辑 % N- ]$ O, C+ j& R ?7 F% C9 G
问题描述3 i4 L8 w x% Y4 K6 V
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 0 _1 ~( W0 e; Y0 y. @
1.数据去重样例样例数据表 quancheng_test
% s; `# s- K! r4 M
$ L, C0 i2 M# A5 {# q! I% j功能需求:按 name 进行去重,把 id 查出来。: g9 U/ N U' v$ \
方案1: - select id from table group by name;
复制代码结果1: 2 a5 t& y; w! n* y k0 Y) Y
: j) T& Z: A: \4 E- w' d8 P* D' Z& f
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: & R. ^8 k* L( f
+ V9 w( ]+ N3 r& ]8 Y% L9 a) z
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:5 X Y# t* C; G& \0 D
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
0 k- T9 B4 r+ s" k2 @) g+ S8 ^
z7 S& p/ u4 X( jdistinct 是查询出来以后再把重复的去掉5 w: Y. D3 f: A$ a3 `, H. {
性能上 group 比 distinct 要好很多
: {) k' _/ v% x X* ]) N( Q7 r* w' K
|