SELECT COUNT(*)超级慢，讨论一下解决方案

使用的语句：SELECT COUNT(*) FROM answer WHERE uid='10' 查询结果：6963911 使用时间：101.618 秒其中 uid 已经索引，也用过其它 COUNT(其它列字段) 查询一样很慢；如果用 aid 已经索引，aid='10' 查出结果数量少，查询很快；

还能通过优化 SQL 语句来优化吗，如果不行，只能通过 insert +1 及 delete -1 来解决了。

count

uid

select

67 replies • 2018-05-16 09:47:55 +08:00

3dwelcome

May 14, 2018

用 MyISAM 表示速度奇快。而且用 mysql_list_tables 之类的结构查询，就能直接看一共有多少记录。

linpf

May 14, 2018

单表数据上亿，早就该拆表了吧。

Alucns

May 14, 2018

@3dwelcome 现在就是用 MyISAM，数据量小很快的。

kran

May 14, 2018 via iPhone

explain 一下

yiqiao

May 14, 2018

回复数量不少应该记录在类似文章表里面吗。。。

RorschachZZZ

May 14, 2018

按照用户分组全量统计一次，保存起来。以后关于用户回复数的增删改查都来操作这次保存的数据。而且你这个表太大了是个隐患，最好拆。

zhaishunqi

May 14, 2018

我印象中，select count(*) 和 select count(1) 的效率,在数据量大的情况下,差别还是很大的.
只是前者后者用法有略微的差别，会用就能避坑。

q397064399

May 14, 2018

如果并发量不是很大的话，+1 -1 应该是个不错的选择

glues

May 14, 2018

这个问题快成日经贴了，不要用 MySQL 不就好了

doubleflower

May 14, 2018

这种东西明显是要保存每个分组的 count，以后发贴+1

mchl

May 14, 2018

试一下
SELECT COUNT(uid) FROM answer WHERE uid='10';

FrailLove

May 14, 2018

物化视图查询重写了解一下

ourzhang

May 14, 2018

COUNT （ 1 ）试试。

xi4oh4o

May 14, 2018

如果需求不用很精准的话，可以尝试用 explain select count(*) from table 取

af463419014

May 14, 2018

分区表,了解一下

比如: PARTITION BY HASH (uid) PARTITIONS 1000

sagaxu

May 14, 2018 via Android

主流关系数据库 count 需要遍历，时间复杂度是 O(n)

akstrom

May 14, 2018

SELECT COUNT(uid) FROM answer WHERE uid=10;

zqguo

May 14, 2018

回答 count(1)的认真看过题主的问题吗？

tianzx

PRO

May 14, 2018 via Android

VoidChen

May 14, 2018

count 个字段，不要 count * 。然后就是搞分区。还不行就上 mpp，我用起来感觉 mpp 比 oracle 要快一丢丢，千万级数据的表，没实测，有时间打算试一下

puritania

May 14, 2018

这种东西用 redis 做个计数器不就完了吗，动态更新计数器。

VoidChen

May 14, 2018

没看到下面还有详细的不好意思。。。我觉得这种回复用 count 有点反人类了，给个字段 update +1 -1 吧。。。。

linbiaye

May 14, 2018

说 count(*)不如 count(1), count 字段的都是瞎说，加了索引还慢就考虑其他方案把。看看有没有可能自己维护计数器，估计跑不了拆分了。

kkeiko

May 14, 2018

说不要 count(*) 的估计不知道查询优化器这个东西吧，至于楼主这个问题，拆表吧。

Alucns

May 14, 2018

@mchl 这样也是很慢的，试过了，估计是内容太多的问题。

dante3imin

May 14, 2018

我看好多人说 count （*）和 count （字段）的区别，之前看到一篇[博文]( https://blog.ti-node.com/blog/6343811157316337664)

jelinet

May 14, 2018

我也维护了一个计数的，但因为计数前业务复杂，写了很多逻辑代码，后来又加了锁，有时候真想 count 了之，但理智告诉我绝对不行，继续维护吧。

lihongming

May 14, 2018 via Android

记得 discuz 的做法是+-1，且定时重算

defclass

May 14, 2018 via Android

uid 是 string 还是 integer ? 遇到过一个类似的坑

elarity

May 14, 2018

@VoidChen 说反了，对于 innodb 引擎，毫无疑问用 count(*)，count （ col ）弄不好会更慢

Raymon111111

May 14, 2018

讨论 count(*) 和 count(1) 根本没找到重点

没有使用场景?

如果仅仅希望有一个数量, 两个方法

简单一点直接 redis

复杂一点, 把索引带上时间, 今天以前的回复数量是固定的, 每天零点的时候用离线任务把今天以前的回复数量全统计一遍扔到一个地方. 然后再实时计算今天的回复数量, 索引踩上 (uid,ctime) uid=#{uid} and ctime >#{betweenTime} and ctime< #{endTime}

另外一个上亿每天增长千万的表应该要分库分表或者归档