本帖最后由 myskya 于 2019-12-9 11:28 编辑
q; J2 ]0 q A: W3 |% @. C问题描述; j( S+ j# X& B& [" Y
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 2 ^ k0 F# z; i) _1 `1 }" F8 r5 S
1.数据去重样例样例数据表 quancheng_test / d9 H/ H4 z0 @
3 O( i2 {9 z) j/ v {3 t
功能需求:按 name 进行去重,把 id 查出来。
5 V0 U0 u9 m+ `+ h6 D8 {方案1: - select id from table group by name;
复制代码结果1: 8 p% d0 A$ p( Z) n
1 @3 d1 E) O( Y0 u方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: 5 E7 P' q! P9 u; c# l
5 O: R! `; n+ j, O. Y9 v
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
/ y, o3 t f. v/ R% N* j对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
2 {! a1 g3 Z0 E8 u' m, `
) y$ R& n' `: ^* [3 D! v" ^distinct 是查询出来以后再把重复的去掉
t9 n) s/ o$ F5 y1 s/ R性能上 group 比 distinct 要好很多
/ y4 _* M+ R0 F' g% l
1 C2 M4 n" e4 G+ H* `" \! E |