Портал №1 по управлению цифровыми
и информационными технологиями

Бесплатная экспертная база знаний по управлению ИТ

 
Устойчивость
 
Способность конфигурационной единицы или ИТ-услуги противостоять сбою или быстро восстанавливаться после сбоя. Например, бронированный кабель будет противостоять сбою при воздействии нагрузки.
Answer
Оригинальный английский термин
resilience
Answer
Подробности
Устойчивость в ITSM описывает, насколько хорошо конфигурационная единица или ИТ-услуга сохраняет работоспособность при неблагоприятных воздействиях и насколько быстро возвращается в нормальное состояние после сбоя. Акцент здесь не только на «не ломаться», но и на «быстро восстановиться», поэтому устойчивость обычно достигается сочетанием мер по предотвращению сбоев и мер по восстановлению. На практике устойчивость учитывают при проектировании и эксплуатации ИТ-услуг: выбирают топологии с резервированием, настраивают мониторинг, автоматизируют восстановление, определяют процедуры эскалации и восстановления, а также проверяют сценарии восстановления в рабочей среде. Показатели вроде MTRS и целевых значений RTO/RPO помогают количественно оценивать, насколько ИТ-услуга способна быстро восстановиться. В контексте управления сервисными конфигурациями устойчивость связывают с конкретными конфигурационными единицами и зависимостями между ними, чтобы понимать, где единичный сбой приведёт к каскадным последствиям. Вне области этого термина находятся вопросы общей бизнес-устойчивости организации, такие как финансовая устойчивость, кадровая устойчивость или репутационные риски, хотя ИТ-устойчивость может на них влиять.
Answer
Нюансы
Устойчивость часто ошибочно сводят только к резервированию или только к восстановлению после сбоя. На практике устойчивость включает оба аспекта: способность противостоять сбою (например, за счёт физической защиты, отказоустойчивой архитектуры, ограничений по нагрузке) и способность быстро восстанавливаться (за счёт автоматизации, готовых обходных решений, отработанных процедур восстановления). Ещё одна частая путаница — с доступностью и надёжностью. Доступность описывает долю времени, когда ИТ-услуга доступна, а надёжность — склонность к отказам/сбоям; устойчивость же подчёркивает поведение при воздействиях и после сбоя, то есть «выдержать удар» и/или «быстро вернуться». Устойчивость также не равна ремонтопригодности: ремонтопригодность — про удобство и скорость восстановления с точки зрения конструкции и поддержки, а устойчивость шире и включает предотвращение сбоев. Важно не путать устойчивость отдельной конфигурационной единицы или ИТ-услуги с устойчивостью организации: последняя охватывает способность организации продолжать достижение результатов в изменяющихся условиях и при катастрофах, включая не-ИТ аспекты. Наконец, устойчивость не гарантирует отсутствие инцидентов; она снижает вероятность и/или сокращает последствия, но при неверных зависимостях КЕ один сбой всё равно может вызвать крупный инцидент.
Answer
Примеры
  • Кластер базы данных с автоматическим переключением на второй узел при сбое основного узла
  • Два независимых канала связи для критичной ИТ-услуги, где при сбое одного канала трафик автоматически маршрутизируется по второму
  • Бронированный кабель в производственной зоне, который выдерживает механическую нагрузку и снижает вероятность сбоя
  • Автоматическое восстановление сервиса в рабочей среде через перезапуск и переразвёртывание при обнаружении сбоя мониторингом
  • Предварительно согласованное обходное решение, позволяющее быстро восстановить предоставление услуги при сбое внешнего поставщика
Courses
Рекомендуемые продукты по этой теме
 
 
Что такое устойчивость в ITIL и ITSM? Смотрите в глоссарии по управлению ИТ, входящим в бесплатную экспертную базу знаний по управлению ИТ от компании Cleverics.