最近我们的 CI 系统升级了一下,开始使用 AWS EC2 Autoscaling,放弃了 Kubernetes (顺带吐槽一下 AWS 永远不会去修他们的 CNI bug )。
目前我们在使用 AWS Cloudwatch 来检测 autoscaling group 的健康状况,但只有很简单的信息像 CPU 负载等。我们计划部署一套服务器集群监控,请大家推荐一下自己觉得好用的。
需要的功能:
1
DearTanker 2020-10-08 03:28:54 +08:00
插眼标记,同样需要,不喜欢自建,倾向国外的收费服务,目前在用 hetrixtools.com
|
2
ladypxy 2020-10-08 06:04:59 +08:00 via iPhone
微软的 system manager
|
3
yongligua 2020-10-08 07:47:09 +08:00
zabbix
|
4
xabc 2020-10-08 12:41:50 +08:00 via iPhone
prometheus
|
5
Ephzent 2020-10-08 17:17:45 +08:00
prometheus + grafana
|
6
Aksura 2020-10-08 20:26:45 +08:00
ganglia
|
7
DoctorCat 2020-10-09 03:16:46 +08:00
规模不是很大(<千台)的情况下,zabbix 足够了
|