本帖最后由 myskya 于 2019-12-9 11:28 编辑 # ~0 a5 m& E! }
问题描述/ Q3 I7 I1 ^* O5 R
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 , n8 ], ^# a: }
1.数据去重样例样例数据表 quancheng_test
" Y9 E1 ~" M: s- d' |! z3 N6 |# ~( l0 |$ b( P ?
功能需求:按 name 进行去重,把 id 查出来。% W+ E) I$ _3 q" j
方案1: - select id from table group by name;
复制代码结果1:
6 x) @) c' R7 g- y# h! Q( j8 K( ^( f+ T! S P3 J: d) P: [+ B
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
# ^+ T- A8 f* Y' F& @: a) {8 N" b$ [* }
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
& k+ \8 K' V/ u, D( C4 R对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: " f, w* c7 X1 ^/ J0 ~+ ]5 z
8 e4 Q, H$ i H, x) }7 h, Idistinct 是查询出来以后再把重复的去掉 `: ~5 p; T5 s
性能上 group 比 distinct 要好很多 5 W% u. s! K% N. Q ?' ^
$ D% n- g7 m# {) ?+ G: v& P |