本帖最后由 myskya 于 2019-12-9 11:28 编辑 ) R5 P) B4 \( d& K
问题描述& m/ H \: T: O# H9 d! v
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
- x5 E& a: Q8 N/ g- z2 i6 S; h8 D2 Y1.数据去重样例样例数据表 quancheng_test 1 |/ n' R7 {1 l7 V/ `% `
0 X) D; N8 y3 `0 m3 Z9 k2 f
功能需求:按 name 进行去重,把 id 查出来。
' j# ]+ ^+ C6 V! {/ n# o# ]6 K" u( e方案1: - select id from table group by name;
复制代码结果1: * H4 h, U* W( k6 v) Z" j2 M% j
) T( j9 P; h) T
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
& Z) T4 B. }( p; V3 f' N0 K% I1 E$ n4 }. t4 c
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:2 A7 q+ \0 R" v. r9 m1 E
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
! Y, `) _5 ], R# J% p
7 K# W5 o5 g: o1 L& zdistinct 是查询出来以后再把重复的去掉- u. k9 y" b% P8 j) v
性能上 group 比 distinct 要好很多 9 F J5 D6 e! N( H3 K
$ L& i* P8 a' z5 f
|