本帖最后由 myskya 于 2019-12-9 11:28 编辑
( o6 B+ G$ s& Q1 E9 Q4 |: n) U( q; W问题描述
3 T2 @# _ K7 }, {* s查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 5 c5 [: s a9 K1 d; E& Q* _; N0 u
1.数据去重样例样例数据表 quancheng_test
. e% o% N p) u% S. m/ G8 L8 @% _- T2 t H K
功能需求:按 name 进行去重,把 id 查出来。
* S& A0 i0 T+ w+ \方案1: - select id from table group by name;
复制代码结果1: ' J. w! U3 Z" n5 R
$ ^1 Z u) V8 j U. L方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: ) L" W) g/ [$ [: b* J
2 ]/ m% g, d6 V# p! [4 E' v3 V7 i7 D
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
. _0 r# F9 `3 L7 e9 O+ X! }对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
5 k* [4 s) r6 m
6 m' u5 z8 ^" Z8 P: b1 X& A2 Y0 Y+ ~distinct 是查询出来以后再把重复的去掉
' R& C7 M# S w( R: v# A* t性能上 group 比 distinct 要好很多
. L+ @8 \/ X3 y4 A' G. \0 T2 R
|