我线上服务有多个实例,有些实例的机器因为网络问题耗时比较高,目标是找出超过 所有机器平均耗时 的单个实例,怎么配置规则呢?
下面这个规则是不行的
(sum(irate(service_hist_sum{audience="total"}[2m])) by (instance) ) / (sum(irate(service_hits_count{audience="total"}[2m])) by (instance)) >
sum(sum(irate(service_hits_sum{audience="total"}[2m])) / sum(irate(service_hits_count{audience="total"}[2m])))