这是一个创建于 3848 天前的主题,其中的信息可能已经有所发展或是发生改变。
我们是腾讯游戏运营支撑体系的开发团队(深圳总部)。LOL,天天酷跑等热门游戏的发布变更,监控告警这些运维日常工作都会在我们团队的平台上完成。如果你对以下工作内容感兴趣,请联系我们:
1、改变数万台服务器的发布变更模式
深刻理解puppet/chef/saltstack/ansible与fabric/bash模式的区别。有意愿开发接地气地解决方案与现有平台结合,并且在工具与平台的基础上改变百人规模的运维团队的工作方式,逐步把运维模式改进得更加一致可靠。
2、算法分析海量metrics
根据多路metrics用算法综合分析是否扩容缩容的决策。根据多路metrics用算法综合分析出是否有系统异常,程序bug,网络波动。希望你起码知道Holt-Winters, Exponential Weighted Average等概念
3、故障自动分析与处理
自动化的告警处理,全流程打通地完成日常性的故障处理操作。对于业务监控告警,综合多个告警来源做根本原因定位。对于批量关联告警,根据告警间的内在联系做通知上的收敛和处理方面的异常防御。
主要技术栈:stackless python/django mysql/mongodb/redis storm/hadoop
团队信奉敏捷开发方式,快速迭代。产品以MVP的形式验证,灰度使用,然后再全面推广。
也有部分产品使用PHP开发,有资深PHP开发者也请联系我们。
待遇方面:
1. 薪水:根据你的经验和条件,公司会为你评定合适的职级,给出让你满意的薪水
2. 福利:腾讯标准福利
联系方式:
请联系 blueking< dot >jobs< at >gmail< dot >com, 最好附上简历,和在github/bitbucket里的个人作品~
项目组直招,用gmail只是为了方便项目组内共享简历。