MTTR 常指 Mean Time to Repair(平均修复时间)或在部分语境下指 Mean Time to Restore/Recovery(平均恢复时间):用来衡量设备、系统或服务从故障发生到修复/恢复正常所需的平均时间,是可靠性工程、运维(IT Ops)与SRE中常见指标。(不同组织对“Repair/Restore/Recovery”的口径可能略有差异。)
/ˌɛm tiː tiː ˈɑːr/
Our goal is to reduce MTTR to under one hour.
我们的目标是把 MTTR 降到一小时以内。
By improving monitoring, runbooks, and on-call processes, the team significantly lowered MTTR after several production incidents.
通过改进监控、运行手册(runbooks)和待命响应流程,团队在多次生产事故后显著降低了 MTTR。
MTTR 是由工程与运维领域常用的缩略语构成:Mean(平均)+ Time(时间)+ To(用于引出目的)+ Repair/Restore(修复/恢复)。它与 MTBF 等指标一起,用于量化系统可靠性与维护效率。