Портал №1 по управлению цифровыми
и информационными технологиями

Бесплатная экспертная база знаний по управлению ИТ

 
Расширенный жизненный цикл инцидента
 
Детальные стадии в жизненном цикле инцидента. Стадии: обнаружение, диагностика, ремонт, восстановление, возобновление. Расширенный жизненный цикл инцидента используется, чтобы помочь понять все вклады в влияние инцидентов и спланировать, как эти вклады могут контролироваться или уменьшаться.
Answer
Оригинальный английский термин
expanded incident lifecycle
Answer
Подробности
Расширенный жизненный цикл инцидента — это способ рассматривать инцидент более детально, чем «от регистрации до разрешения», чтобы увидеть, где именно формируется суммарное влияние на услугу и на клиентский опыт. На практике его применяют в управлении инцидентами для анализа длительности и потерь на разных этапах: сколько времени заняло обнаружение (например, мониторинг сработал поздно или пользователь сообщил не сразу), сколько — диагностика (поиск симптомов и определение, что именно не работает), сколько — ремонт (устранение непосредственной неисправности), сколько — восстановление (возврат компонентов/среды в работоспособное состояние), и сколько — возобновление (фактическое возвращение услуги к нормальному уровню и подтверждение пользователями/заказчиком). Такой разбор полезен при разборе крупных инцидентов, при настройке мониторинга и событий, при улучшении взаимодействия сервис-деска и команд поддержки, а также при планировании мер, которые снизят влияние будущих инцидентов (например, сокращение времени обнаружения за счёт корректных событий и порогов). При этом термин не описывает устранение первопричины и предотвращение повторов — это область управления проблемами и работы с известной ошибкой, а не самого жизненного цикла инцидента.
Answer
Нюансы
Частая ошибка — воспринимать расширенный жизненный цикл инцидента как обязательный «процессный маршрут» для каждого инцидента. На деле это аналитическая модель, помогающая разложить влияние по времени и понять, где нужно совершенствовать практики и средства. Также нередко путают обнаружение с регистрацией: обнаружение может произойти автоматически через мониторинг и событие, а регистрация в сервис-деске — позже; это важно, иначе метрики будут искажены. Диагностику иногда смешивают с управлением проблемами: в инциденте диагностика направлена на быстрое восстановление услуги (в том числе через обходное решение), а не на доказанное установление первопричины и её устранение. Ещё одна типовая путаница — между ремонтом, восстановлением и возобновлением: ремонт может исправить компонент, но услуга может не возобновиться из‑за незавершённых транзакций, кэшей, репликации или необходимости подтверждения со стороны пользователя. При анализе вкладов важно согласовать точки отсчёта и критерии перехода стадий, иначе сравнение инцидентов между услугами и командами поддержки становится некорректным и приводит к ложным выводам о производительности или результативности.
Answer
Примеры
  • Сбой ИТ-услуги корпоративной почты: обнаружение по событиям мониторинга, диагностика — проверка очередей и DNS, ремонт — перезапуск/исправление конфигурации, восстановление — поднятие сервисов, возобновление — подтверждение пользователями отправки и получения писем
  • Недоступность VPN: обнаружение по обращениям пользователей, диагностика — проверка сертификатов и шлюза, ремонт — замена просроченного сертификата, восстановление — восстановление туннелей, возобновление — проверка доступа к внутренним системам
  • Отказ дисковой подсистемы: обнаружение по алертам, диагностика — определение неисправного контроллера, ремонт — замена оборудования, восстановление — перестроение RAID и возврат томов, возобновление — запуск приложений и подтверждение нормальной работы транзакций
  • Крупный инцидент в интернет-магазине: обнаружение по падению конверсии и алертам, диагностика — выявление деградации базы данных, ремонт — изменение параметров и очистка блокировок, восстановление — стабилизация производительности, возобновление — восстановление оформлений заказов без ошибок
Courses
Рекомендуемые продукты по этой теме
 
 
Что такое расширенный жизненный цикл инцидента в ITIL и ITSM? Смотрите в глоссарии по управлению ИТ, входящим в бесплатную экспертную базу знаний по управлению ИТ от компании Cleverics.