本帖最后由 myskya 于 2019-12-9 11:28 编辑 / X6 {# Q' O% U+ V: g3 v; |* V
问题描述) t+ S% c& T9 p; o* C
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
7 r$ J, k4 o1 W. K; d+ D1 d0 _9 D2 B1.数据去重样例样例数据表 quancheng_test ' f' C# o$ Z: {
; I- c: O q4 k* l9 z0 ?
功能需求:按 name 进行去重,把 id 查出来。6 a% S; S- T. `. m
方案1: - select id from table group by name;
复制代码结果1:
, }0 S) D0 \" Z
% j6 F. s+ \/ c6 C方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: + k+ J& `7 H: K3 R6 {- z4 k6 {
1 ]6 f/ o: u. {- J6 p& K0 P9 B0 @
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:2 J" o! M. @0 O, L% b9 b) W
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
/ h! j2 L/ \, f% y5 [0 V: {
- `! X; ^* x6 y3 |, Xdistinct 是查询出来以后再把重复的去掉
! f2 H) R4 O) j& g' C4 C9 [性能上 group 比 distinct 要好很多 ' ]' W: k. h9 n- {
- k6 D" h3 O+ s1 e3 E9 ~
|