最近我们的 CI 系统升级了一下,开始使用 AWS EC2 Autoscaling,放弃了 Kubernetes (顺带吐槽一下 AWS 永远不会去修他们的 CNI bug )。
目前我们在使用 AWS Cloudwatch 来检测 autoscaling group 的健康状况,但只有很简单的信息像 CPU 负载等。我们计划部署一套服务器集群监控,请大家推荐一下自己觉得好用的。
需要的功能:
- 节点可以部署在我们一台服务器上
- 可以主动或被动发现新的服务器节点
- 需要统计 CPU/内存 /硬盘等信息
- 需要能够统计自定义信息,比如某台机器上的 docker container 数量
- 需要支持历史记录,比如查询在某个某个时间段内记录的信息
- 最好有 Web 截面
- 可以付费