Портал №1 по управлению цифровыми
и информационными технологиями

Бесплатная экспертная база знаний по управлению ИТ

 
Сбой
 
Потеря способности работать в соответствии со спецификацией или предоставлять требуемый выход или результат.
 
Синонимы
отказ
Answer
Оригинальный английский термин
failure
Answer
Подробности
Сбой в ITSM означает, что компонент, система, услуга или процесс перестаёт выполнять то, что от него ожидается по согласованной спецификации, и в результате не может обеспечить нужный выход или результат. Это понятие фокусируется на факте утраты работоспособности, а не на том, кто заметил проблему или как она оформлена организационно. Сбой может проявляться как полная остановка функции (например, модуль не запускается) или как частичная деградация, когда требуемый результат больше не достигается (например, время обработки транзакции выходит за допустимые границы и результат для заказчика не обеспечивается). В практике управления мониторингом и событиями сбой часто обнаруживается через события и метрики, а затем может привести к инциденту, если затрагивается ИТ-услуга. Понимание сбоев важно для анализа надёжности и ремонтопригодности, расчёта MTBF и MTRS, а также для приоритизации работ по восстановлению и предотвращению повторений. Вне области понятия «сбой» находятся плановые остановки и вывод из эксплуатации, а также изменения, которые временно ограничивают функциональность по согласованию, поскольку это не утрата способности работать, а управляемое состояние.
Answer
Нюансы
Сбой часто путают с инцидентом: инцидент — это незапланированное прерывание услуги или снижение качества услуги, тогда как сбой — факт потери способности компонента или услуги работать по спецификации. Сбой может происходить «внутри» и не стать инцидентом, если есть достаточная избыточность или обходное решение и потребление услуги не страдает. Также сбой не равен ошибке: ошибка — это дефект или неверное состояние, которое может привести к сбою, но не обязано приводить к нему немедленно. Например, ошибка в коде может годами существовать без проявлений, пока не возникнет редкий сценарий использования, после чего произойдёт сбой. Сбой не является проблемой: проблема — это причина одного или нескольких инцидентов; сбой может быть симптомом, который расследуется в управлении проблемами, но сам по себе не объясняет первопричину. Ещё одна ловушка — трактовать сбой как исключительно аппаратный отказ. На практике сбой одинаково применим к ПО, интеграциям, людям и процессам, если они не обеспечивают требуемый выход или результат. Наконец, не любой «сбой теста» в тестовой среде равнозначен сбою в рабочей среде: важно соотносить это с согласованной спецификацией и требованиями гарантии.
Answer
Примеры
  • RAID-контроллер перестал отвечать, из-за чего база данных не может выполнять операции записи и не обеспечивает требуемый результат для ИТ-услуги
  • После обновления библиотек сервис перестал обрабатывать часть транзакций и не выдаёт корректный выход по спецификации API
  • Сбой сетевого интерфейса на коммутаторе приводит к потере связности сегмента, но пользователи не замечают из-за резервного канала
  • Задание резервного копирования завершается с ошибкой и не создаёт требуемый выход (резервную копию), хотя ИТ-услуга для пользователей продолжает работать
Courses
Рекомендуемые продукты по этой теме
 
 
Что такое сбой в ITIL и ITSM? Смотрите в глоссарии по управлению ИТ, входящим в бесплатную экспертную базу знаний по управлению ИТ от компании Cleverics.