本帖最后由 myskya 于 2019-12-9 11:28 编辑
2 O5 L. j2 o* p$ m2 J5 x* t问题描述7 z$ ]8 }% d/ q m
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 ! z- \& b7 K, L$ ^5 M. J1 G/ d
1.数据去重样例样例数据表 quancheng_test
7 T; J! r5 s! @- y$ _# J* U2 _6 T. w
功能需求:按 name 进行去重,把 id 查出来。
* R5 \1 v& Z( W- u4 K, z: @8 k方案1: - select id from table group by name;
复制代码结果1: ( H% O1 o, j/ R$ v! M: y
! Z8 C- ]% t6 v) l( |# R
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
# }; L! a* K9 U5 \3 `0 F
" B2 X& Q& V0 r/ c: g0 H! \2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:+ t$ L5 J/ s# a! M
对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
) ]; Y9 `6 r3 L% \
5 K6 a$ z$ M, | Ldistinct 是查询出来以后再把重复的去掉; z8 H: |0 x, Q) q' z v
性能上 group 比 distinct 要好很多 ' r( K! ?- m. R& s& R9 C
D' Y+ A5 \1 o4 w
|