Портал №1 по управлению цифровыми
и информационными технологиями

Бесплатная экспертная база знаний по управлению ИТ

 
Восстановление
 
Деятельность по возвращению конфигурационной единицы к нормальной работе после сбоя.
Answer
Оригинальный английский термин
recovery
Answer
Подробности
Восстановление в ITSM — это практическая операционная деятельность, направленная на то, чтобы после сбоя снова сделать конфигурационную единицу работоспособной и пригодной для использования в рабочей среде. Восстановление может выполняться вручную или автоматически и часто является ключевой частью управления инцидентами, поскольку позволяет быстрее вернуть услугу к ожидаемому уровню, даже если первопричина ещё не устранена. Восстановление может включать перезапуск компонента, переключение на резервный экземпляр, восстановление данных до согласованной целевой точки восстановления, развёртывание исправной версии, возврат к базовому состоянию, замену аппаратного компонента или пересоздание конфигурации. Важно, что объектом восстановления является именно конфигурационная единица, а не обязательно вся услуга целиком, хотя на практике восстановление критичных КЕ часто непосредственно восстанавливает предоставление услуги и снижает влияние на заказчика и пользователей. Восстановление не охватывает долгосрочное устранение причины сбоя, анализ тенденций, управление рисками или улучшения по итогам инцидента; эти задачи относятся к управлению проблемами, постоянному совершенствованию и связанным практикам.
Answer
Нюансы
Восстановление часто ошибочно отождествляют с «решением» инцидента. На практике инцидент может быть формально закрыт только после подтверждения восстановления нормальной работы и выполнения необходимых действий по коммуникациям и фиксации записи, но само восстановление — лишь часть работ, а не весь цикл управления инцидентами. Также восстановление не равно обходному решению: обходное решение — это способ уменьшить влияние инцидента, который может позволить продолжить работу без восстановления исходной конфигурационной единицы (например, переход на альтернативный сервис или ручной процесс), тогда как восстановление возвращает КЕ к нормальной работе. Ещё одна частая путаница — между восстановлением и планом восстановления после катастрофы: восстановление применяется и при локальных сбоях отдельных КЕ, тогда как меры после катастрофы связаны с масштабными сценариями и целями целевого времени восстановления и целевой точки восстановления на уровне услуг и критичных компонентов. Распространённое заблуждение — считать восстановление только «восстановлением из резервной копии»; иногда быстрее и безопаснее восстановить путём замены компонента, отката развёртывания или переключения. Важно контролировать побочные эффекты восстановления: согласованность данных, изменения конфигурации в CMDB, выполнение требований гарантии и влияние на метрики, такие как среднее время восстановления услуги.
Answer
Примеры
  • Перезапуск сервиса баз данных на сервере после сбоя процесса и проверка, что конфигурационная единица снова обрабатывает транзакции
  • Переключение на резервный узел кластера после сбоя основного узла с последующим возвратом работоспособности конфигурационной единицы в рабочей среде
  • Восстановление виртуальной машины из снимка после неудачного развёртывания, чтобы вернуть конфигурационную единицу к нормальной работе
  • Замена неисправного диска в массиве и ребилд, после чего конфигурационная единица снова обеспечивает требуемую производительность и доступность
Courses
Рекомендуемые продукты по этой теме
 
 
Что такое восстановление в ITIL и ITSM? Смотрите в глоссарии по управлению ИТ, входящим в бесплатную экспертную базу знаний по управлению ИТ от компании Cleverics.