Портал №1 по управлению цифровыми
и информационными технологиями

Бесплатная экспертная база знаний по управлению ИТ

 
Единая точка сбоя
 
Любая конфигурационная единица, которая может вызвать инцидент при отказе ИТ и для которой не была внедрена контрмера. SPOF может быть человеком или шагом в процессе либо деятельности, а также компонентом ИТ-инфраструктуры.
 
Синонимы
SPOF
Answer
Оригинальный английский термин
single point of failure, SPOF
Answer
Подробности
Единая точка сбоя — это элемент, отказ которого непропорционально влияет на предоставление ИТ-услуги, потому что отсутствует предусмотренная избыточность, замещение или иной способ снизить риск. В ITSM этот термин используют при проектировании услуг, управлении доступностью, управлении непрерывностью услуг, управлении рисками и управлении сервисными конфигурациями, чтобы выявлять места, где один компонент, роль или шаг в процессе фактически «держит» на себе работоспособность потока создания ценности. Практическое применение обычно включает идентификацию SPOF в архитектуре и операционной модели услуги, оценку вероятности и влияния, согласование приоритетов устранения и фиксацию решений в конфигурации и эксплуатационных процедурах. Контрмерами могут быть техническая отказоустойчивость, организационное дублирование компетенций, регламентация и автоматизация критичных шагов. Вне области термина — любые ситуации, где отказ компонента не приводит к инциденту, а также любые элементы, для которых уже реализована контрмера и отказ не становится единственной причиной нарушения услуги. Также единая точка сбоя не равна «любому важному компоненту»: важность без отсутствия контрмеры сама по себе не делает элемент SPOF.
Answer
Нюансы
Частая ошибка — понимать единую точку сбоя только как «железо» или конкретный сервер. Определение шире: SPOF может быть человеком (например, единственный администратор с доступом), шагом в процессе (ручное утверждение, без которого развёртывание блокируется) или внешней зависимостью. Другая ловушка — смешивать SPOF с «узким местом» производительности: узкое место снижает пропускную способность и влияет на производительность, но не обязательно вызывает инцидент при отказе; SPOF же акцентирует отсутствие контрмеры, из-за чего отказ приводит к инциденту. Также SPOF часто путают с проблемой: SPOF — это характеристика конфигурации и дизайна, указывающая на уязвимость; проблема — причина одного или нескольких инцидентов, которую выявляют и управляют ею в управлении проблемами. Наконец, распространённое заблуждение — считать, что наличие мониторинга или оповещений «устраняет» SPOF. Мониторинг снижает время обнаружения, но не является контрмерой против самого факта возникновения инцидента. Контрмера должна предотвращать отказ, обеспечивать отказоустойчивость или гарантировать восстановление без существенного влияния на ИТ-услугу.
Answer
Примеры
  • Единственный маршрутизатор на выход в интернет для всего офиса без резервного канала и без второго устройства
  • Один экземпляр базы данных без репликации, от которого зависят критичные транзакции ИТ-услуги
  • Единственный сотрудник с правами владельца услуги и знаниями по восстановлению, отсутствует замещение и рабочая инструкция
  • Единственный ручной шаг согласования в процессе изменения, без которого нельзя выполнить развёртывание и нет альтернативного пути
Courses
Рекомендуемые продукты по этой теме
 
 
Что такое единая точка сбоя в ITIL и ITSM? Смотрите в глоссарии по управлению ИТ, входящим в бесплатную экспертную базу знаний по управлению ИТ от компании Cleverics.