V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Showfom
V2EX  ›  问与答

一个专业的系统运维人员,最多能管理多少台服务器?

  •  
  •   Showfom · 2013-05-28 20:22:04 +08:00 · 7780 次点击
    这是一个创建于 4195 天前的主题,其中的信息可能已经有所发展或是发生改变。
    最近快吐血了,管理200多台服务器,还不是一个机房的,给一个客户管理。。。

    然后今天突然几十台机器出问题。。。

    所以想问问,一个专业的运维人员,最多一个人能管理多少台服务器?
    34 条回复    1970-01-01 08:00:00 +08:00
    blankyao
        1
    blankyao  
       2013-05-28 21:44:21 +08:00
    很好奇这200多台是咋管理的,有啥批量管理的办法没?
    DH
        2
    DH  
       2013-05-28 21:47:02 +08:00
    专业的不在管理多少台吧,而是看维护负载多强的系统。
    iqri2000
        3
    iqri2000  
       2013-05-28 21:48:53 +08:00
    监控程序、批量化脚本、puppet、OSA等平台。
    10台、50台、200台应该都差不多了。
    Zhang
        4
    Zhang  
       2013-05-28 21:48:57 +08:00
    在谷歌一个SA要管理4000-5000台服务器(道听途说的)。
    Ultratude
        5
    Ultratude  
       2013-05-28 21:50:56 +08:00 via iPhone
    DD 那个用户?
    plprapper
        6
    plprapper  
       2013-05-28 21:56:18 +08:00
    看标准化程度吧,如果是一个公司的不同业务,那应该可以管理500的样子。如果标准化程度差,自动工具又不多,200-300已经非常累了。
    feiandxs
        7
    feiandxs  
       2013-05-28 22:00:40 +08:00   ❤️ 1
    不专业的代维表示——刚统计了下,截止20130528晚21:30分,我手下保持管理的客户的服务器有213台,包含独立服务器,vps,系统横跨各发行版linux和windows ,有半数服务器是最常见的LNAMP架构,剩下一半乱七八糟干什么的都有……

    我的工具不多,puppet,监控之类,但用的最顺手还是自己这几年攒下来的脚本,其实也都网上抄过来再改的。

    每天实际工作时间大约10小时,算比较累……但再加100台机器,我估计还是10小时。因为这几年我的工作时间好像就没变过。
    qiuai
        8
    qiuai  
       2013-05-28 22:12:15 +08:00
    @feiandxs 求开源或者分享一些工具。。。
    ericFork
        9
    ericFork  
       2013-05-28 22:19:59 +08:00
    想提高管理的数量和整个集群的可用性,主要就靠监控、自动化、冗余吧

    人:机器数的比并不固定,看上面的做得如何了
    feiandxs
        10
    feiandxs  
       2013-05-28 22:29:06 +08:00
    @qiuai 工具脚本都是网上现成的,我大部分时间只是按照自己的习惯和需求修改一些,让自己用的更顺手,每个人面对的状况都是不同的。。。

    要说最好用的工具,excel和todolist……

    不过过段时间可以整理下把自己用的py shell perl脚本们扔上来一些。
    Showfom
        11
    Showfom  
    OP
       2013-05-28 22:43:29 +08:00
    @Ultratude 小DD,乃回家了没
    Showfom
        12
    Showfom  
    OP
       2013-05-28 22:44:22 +08:00
    @feiandxs 求联系方式,求来我公司工作~~
    Showfom
        13
    Showfom  
    OP
       2013-05-28 22:45:59 +08:00
    @Zhang 同一个机房好管理啊,要么都内网 IP,要么外网 IP 都连续的。

    关键是我这都是分布在各个不同的机房的, IP 都不是连续的,超级乱。。。。
    c0878
        14
    c0878  
       2013-05-28 22:54:29 +08:00
    管理不同业务 不同系统的服务器比较累 最累的是做idc售后技术支持 客户各种环境各种乱搞 google那种都是上百台跑集群的 方便批量自动管理
    halfbloodrock
        15
    halfbloodrock  
       2013-05-28 22:57:53 +08:00
    曾经最高管理的线上机器约4500+。。。

    线上机器主要依赖的自动化手段有perl,shell的脚本,一个商业化的自动化工具。因为当时还没有puppet还没产生。

    最头疼的其实还是机器上线之前的安装。因为当时没有配置管理工具,build team安装系统总是会给你来点不一样。。。上线之后经常遇到因为build时候的不完善而导致的各种问题。
    Showfom
        16
    Showfom  
    OP
       2013-05-28 22:57:53 +08:00
    @c0878 啊是啊,我就是做 IDC 的!!!!!各种客户都见过了 有很多很无语的 哎 今天碰到一个客户,几百G硬盘都特么的 HTML,电影站,小说站,全采集的那种。。。。
    Showfom
        17
    Showfom  
    OP
       2013-05-28 22:58:36 +08:00
    @halfbloodrock 上次碰到一个客户来问我为毛单个文件下无法放 10 万个文件。。。。一问,全特么的放 Flash 小游戏的 swf 文件。。。 10 多万个文件都放在一个目录下。。。
    Showfom
        18
    Showfom  
    OP
       2013-05-28 22:59:13 +08:00
    @halfbloodrock 求联系方式取经
    merlin852
        19
    merlin852  
       2013-05-28 23:36:46 +08:00 via Android
    @feiandxs +1 同感!
    linux下还好,批量ssh+脚本命令基本都能搞定,win很麻烦,dos,powershell功能有限(可能我知道的不多,脚本功力有限),操作起来真的很烦,特别是同一个东西得重复做好多次
    ohhe
        20
    ohhe  
       2013-05-28 23:42:23 +08:00
    你的t.tt是在哪里的服务器上,感觉速度不错
    求购买链接
    Showfom
        21
    Showfom  
    OP
       2013-05-29 00:05:09 +08:00
    @ohhe 你访问到了哪个 IP?我用了四个机房做 DNS 轮转呢。。。
    Showfom
        22
    Showfom  
    OP
       2013-05-29 00:05:35 +08:00
    @ohhe 目前有美团云,42qu 的天坛,elinkvps,还有xehost
    likuku
        23
    likuku  
       2013-05-29 00:32:56 +08:00
    @Showfom zfs 吧,单个目录下2^48个文件最多。。。
    ohhe
        24
    ohhe  
       2013-05-29 00:45:13 +08:00
    @Showfom 218.245.3.241
    swulling
        25
    swulling  
       2013-05-29 01:49:52 +08:00
    @Zhang 这个数字只多不少。
    swulling
        26
    swulling  
       2013-05-29 01:51:33 +08:00
    @Zhang 貌似我的形容有问题,Google OP人均 4k的机器是事实,非常厉害
    swulling
        27
    swulling  
       2013-05-29 01:53:53 +08:00
    @c0878
    @Showfom 其实主要和服务和机器有关

    假如同样的配置,同样的服务,500台和1000台有啥大的区别么。

    最伤心的是机器配置不一样,环境不一样,上面跑的服务五花八门。。
    Showfom
        28
    Showfom  
    OP
       2013-05-29 03:30:14 +08:00   ❤️ 1
    @ohhe 这个是 vps.42qu.com 的天坛机房
    Showfom
        29
    Showfom  
    OP
       2013-05-29 03:30:48 +08:00
    @swulling

    机器配置不一样,系统不一样,机房不一样。。。。唯一一样的就是所有国外大大小小的机房都有坑爹的地方。。。
    happlebao
        30
    happlebao  
       2013-05-29 06:05:46 +08:00
    @swulling OP 指代什么?搜不到啊。
    BackBox
        31
    BackBox  
       2013-05-29 08:35:05 +08:00
    @feiandxs
    @halfbloodrock
    求联系方式,,取经。
    swulling
        32
    swulling  
       2013-05-29 10:58:24 +08:00   ❤️ 1
    @happlebao 运维工程师,现在流行叫devops
    happlebao
        33
    happlebao  
       2013-05-30 02:17:04 +08:00
    @swulling 再问一下,OP是哪个词组的缩写?我就查得到SA是system administrator。
    swulling
        34
    swulling  
       2013-05-30 10:44:17 +08:00
    @happlebao
    DevOps (a portmanteau of development and operations)
    --- Google
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1419 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 17:21 · PVG 01:21 · LAX 09:21 · JFK 12:21
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.