本帖最后由 myskya 于 2019-12-9 11:28 编辑 + h& F4 ?1 H/ F+ O9 K" e* k- z) Z
问题描述+ \1 A& ]5 h; P \5 F3 M/ O
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 - I8 N" i2 t% j1 b2 ?! K8 q
1.数据去重样例样例数据表 quancheng_test
4 V. m' s& B2 `& G" ?5 h# ~1 A
' ]9 P/ D8 B* M功能需求:按 name 进行去重,把 id 查出来。, t- J* a6 m! F
方案1: - select id from table group by name;
复制代码结果1:
}. _. @* a0 b
6 e8 Q! b6 l/ S- S方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: : ^% F0 m% _3 e1 W
7 n( N/ y. h; D$ H2 U9 J2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:* a; Q" E% ?, v8 y
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: : s$ C0 z4 T1 V( f/ ~9 k; s
# o* n3 S6 K& E8 _ k
distinct 是查询出来以后再把重复的去掉
- h4 u" R8 E; X0 G性能上 group 比 distinct 要好很多 0 P6 U1 [# ]7 E! `- W: @
# _, A& d! ^& x5 ~) ]# u9 |
|