高危操作强制投屏怎么样?让大家一起盯着点
1
fuzzsh 2023-02-01 23:09:03 +08:00 via Android
处理故障谁还有空看群。。
|
2
MuscleOf2016 2023-02-01 23:16:39 +08:00
小范围修改验证灰度
|
3
perfectlife 2023-02-01 23:46:24 +08:00 via Android
这时候就凸显运维的经验和水平了
|
4
darkengine 2023-02-01 23:52:59 +08:00
预算足的话准备一台一模一样的备机,需要现场敲命令的现在备机上运行一遍,没问题再复制粘贴到生产服务器上执行
|
5
GopherDaily 2023-02-01 23:55:55 +08:00
故障处理是很考验人的,不要寄希望有人能给你 review ,我个人觉得核心的几点:
- 胆大,其实这个是前提,遇到大问题,脑子直接宕机的人是不适合的 - 心细,在得出判断后,再想:如果是 xxx ,那么 yyy ,尽量再去找 yyy 的证据,然后采信 xxx - 日常积累 |
6
8zip 2023-02-01 23:56:59 +08:00 via Android
核心是避免应急场景
紧急情况翻车才是常见的 |
7
opengps 2023-02-02 00:23:05 +08:00
既然已经是在线开发,那么要做的恐怕也就是多备份了。
联机开发错误必然直接影响线上,多个人看一遍比你单独找人测试一遍效率质量都要更低 |
8
idblife 2023-02-02 07:50:40 +08:00 via iPhone
这是真正考验个人水平的时候
|
9
echo1937 2023-02-02 08:41:48 +08:00
1 、危险操作先报告,批准后再操作;
2 、解决方案测试环境上先测过,再上生产环境执行; 3 、现场执行 2 人作业,一人作业一人监护(参考电力作业) |
10
coolloves 2023-02-02 11:37:17 +08:00
我们有紧急情况的时候,都是一人工作 n 人围观.
|
11
killva4624 2023-02-02 16:04:24 +08:00
找那么几个关键的人一起帮你 review 命令;
另外一个个人经验是,涉及到文件覆盖类的话,尽可能保持回滚能力,不能一把梭之后无法回头。 比如要手改代码或者覆盖二进制文件、配置文件,先 cp 一个备份; |