先说背景:
公司线上系统,有个异常打点,数据目前存储在 ES 中,打点参数维度很多(有效的影响因素可能有 10 条左右),量级在每天几千到上万级别。
当线上异常数量波动较大的时候,每次都要人肉去分析下报错原因。比如某个用户短时间内激增报错,某个前端小版本在某次后端后端更新后报错变多。目前这些维度都是人肉基于经验,猜测根源,做关联对比之后,挨个排查,耗时耗力。
所以是否有些工具,可以自动挖掘引发波动的规律,做一些简单判断,然后以图表的形式展现?这样子会节省不少人力。
关于 ES 配套,有了解到 Kibana,看过简单的文档,似乎不满足"自动挖掘"这个点。
1
ted2011 2019-07-17 13:06:23 +08:00
`自动`是个什么意思,别告诉我自动就是自动的意思啊,自动的意思想明白了,大概问题也就有解决方案了。
|