本帖最后由 myskya 于 2019-12-9 11:28 编辑
0 f ?4 _) g& V# B2 ?# ]1 y问题描述
7 s8 L5 F) M& S8 H% n4 J查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 % ? K# A0 j" r. a- ]
1.数据去重样例样例数据表 quancheng_test ; \# E- ^) i* O1 O
" R/ v$ j1 k* O8 _' e" C/ b
功能需求:按 name 进行去重,把 id 查出来。
. A' a8 E9 O r% w方案1: - select id from table group by name;
复制代码结果1:
; G+ ^: Z1 @- D9 L2 A/ t3 B
0 K' e- s$ |; k& k方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
4 T1 z3 Q- A9 b/ u( c7 {
! y) O- O- y2 ?1 O" {+ E% o2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
) p3 `. A& O: Z6 f! `7 L6 [对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
3 ~0 h9 @, n. C( p! Q& a1 W3 ~
+ ^3 M. X# u; o* r+ Y9 h8 Wdistinct 是查询出来以后再把重复的去掉
8 S! ]3 T$ r/ p# l& S7 U1 E性能上 group 比 distinct 要好很多
$ a4 u- h# b) n4 p& ^4 W* {0 d8 ?$ y- }& K- K
|