本帖最后由 myskya 于 2019-12-9 11:28 编辑 2 ]: x" \$ h0 [6 _. n* q# J$ M
问题描述1 w1 S7 Y4 T& o: `5 `
查询数据经常需要对数据表的某一属性进行去重操作,group by 和 distinct 都有去重功能,但是有区别。
0 S* ?, A5 L& T. ]1.数据去重样例样例数据表 quancheng_test
/ |5 b% p Q/ D. p. F
) ?/ G w! c6 S" l功能需求:按 name 进行去重,把 id 查出来。
8 ~0 |# [6 L! h6 k方案1: - select id from table group by name;
复制代码结果1: - ` G/ W) L6 P5 U ~2 V
2 F4 [/ W- k ?6 d( a
方案2: - select id, count(distinct name) from quancheng_test group by name;
复制代码结果2:
4 \% X3 k1 V+ G4 D+ N/ Q& ]
! U+ w) f0 s- i( b2.两种去重方案的区别group 是按组查询的,是一种聚合查询,很多时候是为了做统计用,例如:
$ W6 r' l2 @: E2 m0 I对 name 分组,并统计每组 id 的和, - select sum(id), name from quancheng_test group by name;
复制代码查询结果为:
4 c# [9 D7 m0 R+ h0 X ~
+ M% `$ d. A% t( |distinct 是查询出来以后再把重复的去掉3 G/ S1 l7 _/ J5 {; _2 J6 Y0 Q% E
性能上 group 比 distinct 要好很多 2 H6 k6 k6 E& u- e' P* ?
' [; W- ^6 I6 N% V* k2 l* K |