本帖最后由 myskya 于 2019-12-9 11:28 编辑 2 H# [# Q* O& |+ n d: _
问题描述' w+ _1 y$ R2 [ p$ d+ ~( p
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
0 k/ L! `: w2 D7 u/ L1.数据去重样例样例数据表 quancheng_test 4 T j; l- f/ x
/ Z, v% M; P4 O6 C
功能需求:按 name 进行去重,把 id 查出来。
5 H+ _% N. D, |' P9 d% Y方案1: - select id from table group by name;
复制代码结果1: ! o' ~! P. I3 X+ I7 J
* i# ]6 u) l3 n$ ^* S
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
9 a! u; E. n* U1 d. f! N% U3 Z; u2 a2 g) a p
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:; _6 u/ @' N/ m- x
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
. k+ E! c0 R! `/ H' k- s4 t
, F/ y- Z6 [+ K% N1 {* e: Ydistinct 是查询出来以后再把重复的去掉5 S5 ?2 C5 j9 ^3 {: } D! a- ?
性能上 group 比 distinct 要好很多 ( ]8 Q+ |; o( }
3 ^6 j }7 z) j' ]9 m# w |