| Перейти к полной базе знаний Перейти к полному глоссарию | |
Среднее время наработки на отказ | |
Синонимы MTBF | |
![]() | Оригинальный английский термин mean time between failures, MTBF |
![]() | Подробности Среднее время наработки на отказ (MTBF) используется для количественной оценки надёжности услуги или конфигурационной единицы в эксплуатации. По смыслу это показатель «как часто ломается» в среднем: чем выше MTBF, тем реже происходят сбои. В управлении услугами MTBF применяют для анализа трендов доступности и надёжности, сравнения альтернативных архитектур, обоснования инвестиций в модернизацию, а также для постановки ожиданий к поставщикам и внутренним командам поддержки. На практике MTBF считают по данным мониторинга и истории инцидентов, сопоставляя моменты отказов и период нормальной работы между ними; важно договориться, что именно считается отказом и для какого уровня — для услуги целиком, для конкретной конфигурационной единицы, или для компонента в составе сервисной архитектуры. Термин не описывает скорость восстановления и не заменяет метрики, отражающие восстановление и устранение последствий; он про частоту отказов, а не про время ремонта, длительность простоя или качество обработки инцидентов. |
![]() | Нюансы Частая ошибка — воспринимать среднее время наработки на отказ как «гарантию», что отказ произойдёт ровно через это время. Это статистическая метрика, и реальное распределение отказов может быть неравномерным: после изменения, релиза или развёртывания частота сбоев может резко вырасти, даже если долгосрочный MTBF выглядит приемлемо. Также MTBF регулярно путают со средним временем восстановления услуги (MTRS): MTBF отвечает на вопрос «как часто ломается», а MTRS — «как быстро восстанавливаем». Ещё один подводный камень — смешивание уровней измерения: если считать MTBF для услуги, но фиксировать отказы на уровне конфигурационных единиц без учёта избыточности, можно получить завышенную частоту «отказов», которые фактически не повлияли на потребление услуги. Наконец, некорректные определения отказа и неполные данные мониторинга приводят к несопоставимым значениям: кратковременные деградации, плановые операции и отключения из-за катастрофы должны быть заранее классифицированы, иначе метрика будет искажать выводы и провоцировать неверные управленческие решения. |
![]() | Примеры
|
![]() | Рекомендуемые продукты по этой теме |
Что такое среднее время наработки на отказ в ITIL и ITSM? Смотрите в глоссарии по управлению ИТ, входящим в бесплатную экспертную базу знаний по управлению ИТ от компании Cleverics. | |




