本帖最后由 myskya 于 2019-12-9 11:28 编辑 7 f, \1 W; ^ A. ^& F
问题描述, s: Z' R, ]: m0 ?1 _" h
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 4 [; L& W. v( ~3 B5 f' W6 {
1.数据去重样例样例数据表 quancheng_test
" Y: u* C3 r7 R8 p; n4 A, A! l2 D/ I- Q* R( ?# v4 |) t
功能需求:按 name 进行去重,把 id 查出来。
$ X0 `; j) i! P% t p方案1: - select id from table group by name;
复制代码结果1:
3 a6 v) C G9 Q/ j$ V; K
M+ m' S- s1 K, }! a Y% I方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: % v0 J# M7 N1 |# P
/ m+ I2 i' z J8 [" R4 e
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:6 D, ~- ]; y/ b$ J
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
, I& T% C# q0 ?' u8 R2 y7 n# _6 m9 @* ?2 S) B+ E) D
distinct 是查询出来以后再把重复的去掉' N& S$ j1 w* m7 G v3 B
性能上 group 比 distinct 要好很多 + R( _) q: r& A! q$ K
5 S5 ]# ~5 k- K( p9 n$ T
|