Gtristan
V2EX  ›  问与答

如何集中管理 200 台云服务器

  •  
  •   Gtristan · Jul 14, 2023 · 3210 views
    This topic created in 1040 days ago, the information mentioned may be changed or developed.

    搜罗的帖子说用 k8s 目前还没搭建 k8s ,有其它的铁子说说,你们都是怎么管理多台云服务器( Centos+Ubuntu )的吗 主要实现基本功能如下

    1. 能看服务器在线状态(尽量多显示 cpu 内存等信息那更好)
    2. 服务器离线提醒
    3. 其它系统信息

    有这样的开源平台吗

    21 replies    2023-08-25 18:16:36 +08:00
    JaminT
        1
    JaminT  
       Jul 14, 2023
    Prometheus
    Aliencn
        2
    Aliencn  
       Jul 14, 2023   ❤️ 2
    这个需求只需要一个监控就能实现吧。zabbix 或 prometheus
    GeorgeWai
        3
    GeorgeWai  
       Jul 14, 2023
    先拿出一台机器,然后把公钥丢给下面 200 台机器。然后基于 ssh 可以愉快的玩了,想看啥,就发命令,坐等返回,返回结果里会告诉你哪些机器超时了,5 分钟跑一次即可。
    ropon
        4
    ropon  
       Jul 14, 2023
    jumpserver 统一管理
    prometheus 监控
    ropon
        5
    ropon  
       Jul 14, 2023
    @ropon prometheus+node_exporter 监控
    b7cn
        6
    b7cn  
       Jul 14, 2023
    有个 iis7 的服务器管理工具
    Gtristan
        7
    Gtristan  
    OP
       Jul 14, 2023
    xfXqz1417LakqH82
        8
    xfXqz1417LakqH82  
       Jul 14, 2023
    随便整个探针不就行了?
    graetdk
        9
    graetdk  
       Jul 14, 2023
    哈哈,我想起我当年管理一堆服务器的艰难经历了。不过,如今的技术真是越来越发达了,管理云服务器也变得更加容易。建议可以考虑采用一些云平台的管理工具,或者使用自动化部署等技术,来轻松应对这个数量级的服务器管理工作。祝你好运!
    bytesfold
        10
    bytesfold  
       Jul 14, 2023   ❤️ 1
    说随便整整的一定没有大批量机器😅;

    机器规模一旦起来了管理非常困难,不过基础的开源工具无论如何都是要用的,例如:Ansible 、Prometheus 、ELK
    vast0906
        11
    vast0906  
       Jul 14, 2023   ❤️ 1
    Ansible / SaltStack (批量执行工具) + Prometheus (监控) + Grafana (展示)
    flexbug
        12
    flexbug  
       Jul 14, 2023 via iPhone   ❤️ 1
    监控用 prometheus ,grafana ,alertmanager 管理的话 saltstack ,puppet ,ansible ,jump server 也行
    deorth
        13
    deorth  
       Jul 14, 2023 via Android
    招个好点的运维
    LCD
        14
    LCD  
       Jul 14, 2023 via Android
    jumpserver 简单够用,但不知道为什么批量执行脚本的图标转很久。。。,不知道是否 bug
    LCD
        15
    LCD  
       Jul 14, 2023 via Android
    另外 fabric 也是不错,几行就可以跑起来,只是开始接触的时候坑太多了
    Illusionary
        16
    Illusionary  
       Jul 14, 2023
    你都说云服务器了,还需要你搞这些这么基础的监控? 云厂商本来就有,你只要稍微配置一下告警指标和告警渠道就好了
    me1onsoda
        17
    me1onsoda  
       Jul 14, 2023
    就这么简单的需求,云厂商的控制台不就能满足
    wuzhewuyou
        18
    wuzhewuyou  
       Jul 15, 2023 via Android
    蹲个结果,暂时想到写一个 mqtt ,各服务器向总服务台发送状态信息,很容易做到离线提醒,支持一些远程指令等
    nomytwins
        19
    nomytwins  
       Jul 15, 2023
    我们用的 appnode
    Subfire
        20
    Subfire  
       Jul 17, 2023
    Proxmox VE
    chilaoqi
        21
    chilaoqi  
       Aug 25, 2023
    jumpserver + 1panel
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   4703 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 113ms · UTC 04:01 · PVG 12:01 · LAX 21:01 · JFK 00:01
    ♥ Do have faith in what you're doing.