本帖最后由 myskya 于 2019-12-9 11:28 编辑 , X* A# c& K' R) X, B) i! h
问题描述
6 G4 D; z8 U' D7 q9 ?" ]查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
/ _+ p9 I% N! ?+ n1 m3 d: \1.数据去重样例样例数据表 quancheng_test
3 r7 P6 I) _- ?$ L1 z& p9 S2 Y, v- A6 C: W3 d9 f* K
功能需求:按 name 进行去重,把 id 查出来。
7 U# W, u& h" ~- l方案1: - select id from table group by name;
复制代码结果1: / Y4 G- a. ~: i! L" e7 F" e4 t
|2 ?, R; N+ W- t7 o$ C* r# f
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: 5 k) h5 h. t8 ?6 k9 M z7 T
% e$ r' y% ?0 z% q7 Z0 q
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:# U4 e/ s" ?. r: Q/ b- t
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
& P6 C7 v: s" v3 y) V7 l( b7 z0 w8 B3 c* W- e4 t7 W, _0 V O
distinct 是查询出来以后再把重复的去掉; _: ?5 T& G7 d1 v
性能上 group 比 distinct 要好很多 7 V3 S( H ]' n+ W& _7 p; e+ D7 Y
' b& ~% S9 _; a) I3 n# l+ f9 ] |