本帖最后由 myskya 于 2019-12-9 11:28 编辑
" D+ E' B3 j- c$ c5 ]问题描述. {! U" x" P" x1 k( {' m u
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。 4 R# N" r! @, y1 ~. Z
1.数据去重样例样例数据表 quancheng_test
6 p& j3 _6 O' L$ C7 Q2 u( _) V
4 t5 p9 P! c c x& _6 o3 [功能需求:按 name 进行去重,把 id 查出来。6 Q9 U! T6 M$ e1 A* h# l: ?1 a* @; {
方案1: - select id from table group by name;
复制代码结果1: 3 e0 d8 x5 Q$ a7 ?
7 H% ^; a) l2 _- e1 n9 i方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: 6 R6 N2 v! O- {( p
* A9 { X4 i6 \. T
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
" W* c6 ~: U) z# r8 S! v0 ~对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
1 f; T0 a1 k/ [7 X" v* ^) d+ ^) y8 t% t6 |
distinct 是查询出来以后再把重复的去掉
* Z; f; ^; U2 F; _性能上 group 比 distinct 要好很多 # u' b; Z' h" E
' O% z' k1 c* |' _" W6 J% p3 v
|