现象描述
最近一次上线使用了 Reentrant Lock ,上限次日早上 9 点迎来流量高峰,出现较多 RedisTimeoutExcpetion:Command execution timeout for command(EVAL)...(省略的部分是 lua 的加锁和解锁逻辑部分),几天观察下来,一般会在 9:00-9:15 期间自动恢复,后面再也没有任何该搞错出现,待凌晨迎来流量低谷,次日 9 点该现象会再次出现。
伴随着该报错,能观察到的是 redis 节点的 client connection 会在短暂上升后,迎来一个平台阶段,这个阶段报错最多,后快速上升达到一个数值,此时报错也自动恢复。
下面 client connection 的曲线和报错量曲线

使用版本
redisson 2.9.2 redis 为哨兵模式,1 主 2 从 应用 8 个节点,redis client 配置的最大线程数 100 ,即加起来为 800 ,最小空闲线程数 20 ,图中初始的 300 多,是因为其他应用共用了该 redis 集群。
翻了很多关于 redisson 类似问题,没有相似的,目前没有了排查头绪,求助一下。