本帖最后由 myskya 于 2019-12-9 11:28 编辑
, A% L& Y" P4 O: [# v' m问题描述: d5 ?3 |5 K, ~# u
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
5 j. ?* P! h6 W1.数据去重样例样例数据表 quancheng_test 4 ^, S- ~2 ?* O6 ]6 T
1 J6 ~/ D" T- _4 n2 A* L9 f- F
功能需求:按 name 进行去重,把 id 查出来。7 @* {% P# @7 F6 C8 p5 u) ~
方案1: - select id from table group by name;
复制代码结果1:
- g1 H' F% i9 j; D1 q7 s
5 \4 l: \6 L; b& _. o方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2: / B4 [0 e' P. g# ]1 W! Q
5 r: X3 I, q& a. U; b- ?
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
P1 R( v1 H8 n, }对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: p" ?- H* n( G* N+ P7 J& r! k/ n
0 A! t+ Q$ a# k; l+ s! v4 Z. y
distinct 是查询出来以后再把重复的去掉& _3 h" [* b8 j7 ]! s) B$ [8 y
性能上 group 比 distinct 要好很多
5 w; I0 ^, E6 \, \" \! |! h B! ]- P3 o3 T' k
|