本帖最后由 myskya 于 2019-12-9 11:28 编辑 ! c. W% p+ p4 ?! o8 s
问题描述2 |7 t! V7 D- l. ?$ c/ j- E
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 / p I/ ]0 m1 L0 o! @
1.数据去重样例样例数据表 quancheng_test
3 i% ^+ X. [9 D' t1 t- f. ~1 b9 I# S: K$ Z6 ~7 j
功能需求:按 name 进行去重,把 id 查出来。
# ~$ W5 g- Y! `- b4 K) Z方案1: - select id from table group by name;
复制代码结果1: ; M! M) N8 {0 g( O
- ]8 |# [% W. a5 K" H1 ^方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: ! L f3 L# w( [5 M3 ~3 v; W5 M
! q7 U" n" U/ X7 |
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:5 x" A, S* n% s B( h2 Y- @
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: $ Y1 s7 ~4 e7 \6 @
/ ]4 V- G- E1 _% udistinct 是查询出来以后再把重复的去掉
: W: n( J, Q8 c9 v r性能上 group 比 distinct 要好很多 7 Y' J* ~ ^4 `
) `8 {& _) T# w3 G |