本帖最后由 myskya 于 2019-12-9 11:28 编辑
) l( A* h! _& s) U: T J4 y问题描述
l& S1 S: I; s2 L( k* q2 `查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 . a' ]6 F# q2 O) c5 [
1.数据去重样例样例数据表 quancheng_test 6 l. N. n6 r! C! S$ _; h2 ~; n" w8 L' a+ v
$ \1 x9 E: j- ?1 b( y功能需求:按 name 进行去重,把 id 查出来。
9 @/ W3 ^) t7 i" `2 ]方案1: - select id from table group by name;
复制代码结果1:
5 h5 B6 R B8 p7 M. T1 ]- y0 V( I
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
- ^. ?. L: G! X* @) @2 U( X/ n D7 J4 j
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
: z7 U" T5 P' p6 N7 r$ y对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: % H: G! X$ P4 W( s& F
, o! g3 e: Q( w+ m: `6 _ y0 jdistinct 是查询出来以后再把重复的去掉
; H$ f9 ~) F6 b/ E" Z性能上 group 比 distinct 要好很多
4 h+ w' a- d! L t( [# j5 u! G4 L8 A" i
|