Портал №1 по управлению цифровыми
и информационными технологиями

Бесплатная экспертная база знаний по управлению ИТ

 
Среднее время восстановления услуги
 
Метрика того, как быстро восстанавливается работа услуги после сбоя
 
Синонимы
MTRS, среднее время восстановления
Answer
Оригинальный английский термин
mean time to restore service, MTRS
Answer
Подробности
Среднее время восстановления услуги (MTRS) показывает, сколько времени в среднем требуется, чтобы вернуть ИТ-услугу к согласованному уровню после сбоя. В ITSM эта метрика используется для оценки скорости восстановления и, косвенно, способности организации ограничивать негативный эффект от инцидентов. Обычно MTRS измеряют от момента возникновения сбоя или регистрации инцидента до момента фактического восстановления услуги в рабочей среде, то есть когда заказчик и пользователь снова могут получить ценность от услуги в ожидаемом объёме. На практике метрика помогает сравнивать команды поддержки, выявлять узкие места в цепочке восстановления, обосновывать улучшения в управлении инцидентами, управлении мониторингом и событиями, управлении изменениями и управлении валидацией и тестированием, а также проверять достижимость целей по доступности и уровню услуги. MTRS применим как к конкретной ИТ-услуге, так и к сервисному предложению или важному компоненту, если влияние на услугу измеримо. Вне области применения MTRS находятся оценка первопричин (это фокус управления проблемами) и оценка частоты сбоев (её отражают метрики наподобие MTBF), хотя совместный анализ этих показателей часто необходим.
Answer
Нюансы
Частая ошибка — воспринимать среднее время восстановления услуги как «время работы инженера» или длительность активной технической работы. На практике значимы и задержки на маршрутизацию, эскалацию, ожидание доступа, согласование экстренного изменения, развёртывание, а также подтверждение восстановления в рабочей среде; если эти этапы исключать, метрика будет искусственно занижена и станет непригодной для управления услугами. Также MTRS нередко путают с целевым временем восстановления (RTO): RTO — это целевое значение, установленное в рамках управления непрерывностью услуг, а MTRS — фактическая измеряемая метрика, которая может быть лучше или хуже цели. Ещё один подводный камень — разный выбор точки старта и финиша: от события, от инцидента, от момента обнаружения пользователем, от подтверждения командой поддержки. Несогласованные правила приводят к несопоставимости отчётности между услугами и периодами. Важно помнить, что «сбой» не всегда равен «инциденту»: крупный инцидент может включать несколько инцидентов и затрагивать несколько услуг, поэтому правила агрегации должны быть определены заранее, иначе MTRS будет искажаться. Наконец, среднее значение скрывает «хвост» редких, но долгих восстановлений; для управленческих решений полезно дополнять MTRS распределением, медианой и раздельным анализом по классам инцидентов.
Answer
Примеры
  • После сбоя базы данных интернет-банка услуга была восстановлена за 18 минут; это значение вошло в расчёт среднего времени восстановления услуги за месяц
  • В результате ошибки в конфигурации после изменения корпоративная почта была недоступна 2 часа до применения обходного решения; эта длительность учитывается в MTRS
  • Канал связи филиала упал из-за отказа оборудования и восстановился после замены через 6 часов; показатель попал в MTRS для услуги «Доступ в корпоративную сеть»
  • Для крупного инцидента в CRM фиксируют время от регистрации инцидента до подтверждения пользователями восстановления доступа; эти значения агрегируются в среднее время восстановления услуги
Courses
Рекомендуемые продукты по этой теме
 
 
Что такое среднее время восстановления услуги в ITIL и ITSM? Смотрите в глоссарии по управлению ИТ, входящим в бесплатную экспертную базу знаний по управлению ИТ от компании Cleverics.