本帖最后由 myskya 于 2019-12-9 11:28 编辑
) S4 l. D9 F% J问题描述2 r3 H ]9 s. e" D. \6 F- l
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
9 I0 V4 H' `1 H0 ~" I7 |1.数据去重样例样例数据表 quancheng_test
. a6 p2 ~% u, f) @' }1 e( h
+ ?6 _. E, U8 H# ?9 G功能需求:按 name 进行去重,把 id 查出来。 ]" g6 Y* E3 m
方案1: - select id from table group by name;
复制代码结果1:
, f1 N* L. b0 N& S5 B, w
4 c9 \& ]1 P( I- f方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: 8 Y' S- g1 P$ o1 U% m9 o* L
+ J9 S4 h k/ t, N; G# Z; E
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:- x- \7 ~5 Y/ ^2 L, Q# k6 v
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: # `: a9 R. u/ ~; ]5 E; w3 \
/ ?! D" T4 r# `& P0 {/ ]9 jdistinct 是查询出来以后再把重复的去掉# ]* q j z* [" ^. c$ @/ q$ O: d% {
性能上 group 比 distinct 要好很多 " L# ]$ m3 O6 a8 Y" _# E
! u+ d: V2 t" P7 t6 k `& h+ P
|