dangyuluo
V2EX  ›  问与答

求推荐好用的服务器集群监控系统

  •  
  •   dangyuluo · Oct 8, 2020 · 2748 views
    This topic created in 2086 days ago, the information mentioned may be changed or developed.

    最近我们的 CI 系统升级了一下,开始使用 AWS EC2 Autoscaling,放弃了 Kubernetes (顺带吐槽一下 AWS 永远不会去修他们的 CNI bug )。

    目前我们在使用 AWS Cloudwatch 来检测 autoscaling group 的健康状况,但只有很简单的信息像 CPU 负载等。我们计划部署一套服务器集群监控,请大家推荐一下自己觉得好用的。

    需要的功能:

    1. 节点可以部署在我们一台服务器上
    2. 可以主动或被动发现新的服务器节点
    3. 需要统计 CPU/内存 /硬盘等信息
    4. 需要能够统计自定义信息,比如某台机器上的 docker container 数量
    5. 需要支持历史记录,比如查询在某个某个时间段内记录的信息
    6. 最好有 Web 截面
    7. 可以付费
    7 replies    2020-10-09 03:16:46 +08:00
    DearTanker
        1
    DearTanker  
       Oct 8, 2020
    插眼标记,同样需要,不喜欢自建,倾向国外的收费服务,目前在用 hetrixtools.com
    Dragonish3600
        2
    Dragonish3600  
       Oct 8, 2020 via iPhone
    微软的 system manager
    yongligua
        3
    yongligua  
       Oct 8, 2020
    zabbix
    xabc
        4
    xabc  
       Oct 8, 2020 via iPhone
    prometheus
    Ephzent
        5
    Ephzent  
       Oct 8, 2020
    prometheus + grafana
    Aksura
        6
    Aksura  
       Oct 8, 2020
    ganglia
    DoctorCat
        7
    DoctorCat  
       Oct 9, 2020
    规模不是很大(<千台)的情况下,zabbix 足够了
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3284 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 41ms · UTC 12:07 · PVG 20:07 · LAX 05:07 · JFK 08:07
    ♥ Do have faith in what you're doing.