本帖最后由 myskya 于 2019-12-9 11:28 编辑 ' ^( \6 z, c/ R8 M1 |* S% _/ I
问题描述, X% r3 M* _6 j' y) p4 C8 M p
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
3 ~/ p3 ~; r* {8 V- b! z1.数据去重样例样例数据表 quancheng_test 7 b$ P3 O) l0 f z8 z$ m3 H& ?
: Z, Q( T1 F# H8 H2 k7 C功能需求:按 name 进行去重,把 id 查出来。4 g' u- f% z4 c' k
方案1: - select id from table group by name;
复制代码结果1:
4 E1 g: B, d. ^' ]# m9 J
6 |5 L; G4 y& f; j. Q方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
' W; N& t% ~/ O- ^4 Y$ k. A% [9 ?/ O, M$ ^1 I
2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
: m/ l Q1 E4 t+ t对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为: X7 M, e9 y- @2 ]
# ?3 p0 H5 V5 z8 A: k
distinct 是查询出来以后再把重复的去掉" X# b- h$ N, I, @+ {+ }. L
性能上 group 比 distinct 要好很多
{8 N5 f- m: I+ c& e3 ?, U, |+ I( x" x' P9 m
|