在sql server中,distinct关键字可以过滤掉多余的重复记录只保留一条,但往往只用它来返回不重复记录的条数,而不是用它来返回不重记录的所有值。
distinct只有用二重循环查询来解决,而这样对于一个数据量非常大的站来说,无疑是会直接影响到效率的。
来看如下的例子。
比如想用一条语句查询得到name不重复的所有数据,那就必须使用distinct去掉多余的重复记录。
select distinct name from table
结果:
--------
name
a
c
好像达到效果了,可是,我想要得到的是id值呢?改一下查询语句吧:
distinct怎么没起作用?作用是起了的,不过他同时作用了两个字段,也就是必须得id与name都相同的才会被排除。
修改查询语句:
除了错误信息什么也得不到,distinct必须放在开头。
难到不能把distinct放到where条件里?可以,但照样报错。
以下方法是可行的:
select *, count(distinct name) from table group by name
结果:
id name count(distinct name)
1 a 1
2 b 1
3 c 1
最后一项是多余的,管用即可。
注意:
group by 必须放在 order by 和 limit之前。