工作职责:
钻研大规模分布式服务架构与资源管理,推动业务架构优化,性能优化,成本优化
参与公司国内外整体机房建设,提升边缘网络覆盖和质量,为 SD-RTN 提供最优质的接入与使用体验布局
推动及开发高效的自动化服务,提升工程效率,研发服务自动化管理与决策平台,提高运维、开发协作效率,规范操作流程,向 AIOps 方向迭代
建设、完善并维护基础设施服务,包括不限于资源管理、容量规划、监控告警、业务发布、权限管理、扩容缩容、流量调度等
持续改进基础设施质量,对系统隐患和安全风险及时排查分析,从硬件迭代、网络调优、操作系统优化等多维度着手提高系统可用性
尝试各种前沿技术、产品方向、研究方向,丰富团队的技术积累
任职资格:
具备良好的的计算机网络和体系结构基础
责任心强,积极主动,敬业抗压,较强团队意识,较强的安全风险意识和跟进能力有良好的编程基础和 debug 能力,掌握 Golang,Python,Shell 等语言中的一种,可以通过程序解决工作中遇到的效率问题
熟悉 Linux 系统( ubuntu 优先)的管理和优化,熟悉服务器搭建、配置、监控、性能优化和维护,能熟练使用相关分析命令和工具,如 mtr 、tcpdump 、strace 、netstat 、iperf 、dstat 、iostat 、top 、sar 、vmstat 、dig 等
熟悉网络知识及典型协议原理,具备故障分析和处理能力
熟练使用至少一种配置管理工具( Ansible/Puppet/SaltStack )
熟悉一至多种监控和报警相关工具(如 Zabbix/Prometheus/InfluxDB/Kapacitor )
联系方式:
微信:18621580540
邮箱:
[email protected]