5 月 6 日,优维科技和数人云联合主办的 DevOps&SRE 系列活动《 DevOps&SRE 超越传统运维之道》在深圳顺利举行。
优维科技 CEO 王津银、数人云 CEO 王璞、腾讯 SNG 运维负责人梁定安分别分享了《 DevOps 与传统的融合落地实践及案例分享》《 SRE 在传统企业中的落地实践》《 DevOps 最后一棒,有效构建海量运营的持续反馈能力》,为大家带来了一场异彩纷呈的技术盛宴。
△场面爆满
除了 DevOps、SRE 相关的经验,还有具体落地的案例分享,会后大家都反馈收获满满,期待我们的下一次系列活动。在这里先做个小预告:DevOps&SRE 系列活动北京站,将于 6 月 10 号与大家见面!
优维科技作为 DevOps 理念的践行者,除了我们的平台以外,还希望通过技术分享的方式让更多企业因 DevOps 理念受益,真正的为运维行业带来一些改变。
以下为现场回顾
#DevOps 与传统的融合落地实践及案例分享#
△优维科技 CEO 王津银
演讲内容:主要分为以下三个部分,第一个是 devops 全局的理解以及 DevOps 与 ITIL 的对比融合,第二个是 devops 落地经验 14 则,第三个是德邦物流的案例分析。
DevOps 落地经验 14 则
第一则:理念与价值先行,到底什么是理念什么是价值? 第二则:顶层设计与全局规划 第三则:Start Small,从小做起 第四则:构建 IT 元数据平台,驱动 IT 平台间整合。过去传动的平台为什么没有很好的应用起来,依然面向研发者管理、整个的交付过程,没有进入到 IT 运营,这里怎么样构建一个元数据平台。
第五则:痛苦的事情优先解决,这一点来源于持续交付的原则。 第六则:工具也是一种文化,人过分的强调驱动文化因素的时候,比如说把 devops 必须要把领导的思维改变,这一点非常的困难,能不能从实际的地方做起,比如说工具和工程师的文化推行,这里面讲的工具也是一种的文化。强调它的文化作用。
第七则:组织二元性,加强落地力。 第八则:价值拉动,而非事务驱动。更多是面向客户的价值。 第九则:平台+插件化=服务能力产品化,和组织一致。 第十则:自动化别人,先自动化自己,先把自己的能力自动化再插件化到上层平台去。
第十一则:持续交付是 DevOps 落地的最佳实践 第十二则:IT 运营管理驱动 Ops 能力建设 第十三则:构建面向应用的最强管理驱动力。 第十四则:构建指标,驱动 DevOps 落地
以上是王津银关于 DevOps 实践的一些具体经验分享,随后结合物流行业案例进行进一步讲解。
演讲实录敬请期待我们的后续文章
#SRE 在传统企业中的落地实践#
△数人云 CEO 王璞
演讲内容:Google 的 SRE 是 DevOps 思想在运维方面的具体实践。本次介绍了 SRE 理念、传统运维模式与 SRE 的区别、SRE 落地实践的关键点以及具体的落地实践案例分析。
SRE 落地的关键点:
1 )建立体系化平台;平台和工具实现自动化、自助化;平台和工具落地各项规章管理制度。 2 )容量规划与容量管理 3 )保障 SLO 并最大化迭代速度 4 )建立有效监控,谷歌内部对监控尤其是对报警及其的严格的,每一个报警出来必须有明确的动作。三种有效的输出:告警、工单、日志。
以上王璞所提到 SRE 落地实践的关键点,都是在谷歌得到了很好的落地,同样在其他企业也能进行借鉴参考。
演讲实录敬请期待我们的后续文章
#DevOps 最后一棒,有效构建海量运营的持续反馈能力#
△腾讯 SNG 负责人梁定安
演讲内容:以腾讯运维团队打造的业务监控和指标度量体系为背景,解读大规模技术运营场景下,实现业务质量持续反馈的方法和技巧。
对于运维团队而言,持续反馈意味着什么?要做好监控、告警和运营,大梁认为这 3 点是缺一不可的。其中运营很重要,通过运营可以把一些我们想做好,但是需要其他团队或角色协同我们完成的事情,落实下去,推进执行好,这点很 DevOps。
持续反馈于运维的理解 1 )监控(覆盖率、状态反馈、指标度量) 2 )告警(时效性、准确性、触及率) 3 )运营( RCA、事件管理、报表/考核)
本次演讲大梁重点要跟大家分享的另一内容,在腾讯做海量监控数据分析的技巧: 1 )溯源(多维分析、级联分析) 2 )根因(递进收敛、ROOT ) 3 )优选( DLP、舆情分析)
感谢各位讲师的精心筹备,感谢各位到场嘉宾的大力支持,优维科技将带着 DevOps 管理专家的使命,分享最新的技术理念、DevOps 实践经验。希望更多的企业能因 DevOps 而受益。
演讲实录敬请期待我们的后续文章