Портал №1 по управлению цифровыми
и информационными технологиями

Бесплатная экспертная база знаний по управлению ИТ

 
Анализ сбоев и последствий
 
Подход к оценке потенциального влияния сбоев. FMEA предполагает анализ того, что произойдёт после сбоя каждой конфигурационной единицы, вплоть до эффекта на бизнес. FMEA часто используется в управлении информационной безопасностью и в планировании непрерывности ИТ-услуг.
 
Синонимы
FMEA
Answer
Оригинальный английский термин
failure modes and effects analysis, FMEA
Answer
Подробности
Анализ сбоев и последствий (FMEA) используется, когда организации важно заранее понять, какие отказы наиболее опасны, где «тонкие места» в ИТ-услуге и как сбой отдельных конфигурационных единиц может привести к нарушению результатов бизнеса. Практически FMEA помогает системно разобрать услугу или ключевой компонент на составные части, определить возможные режимы сбоя, оценить последствия для пользователей и заказчика, а также определить меры предотвращения или снижения ущерба. В ITSM это применимо при проектировании и изменении ИТ-услуг, при управлении рисками, при построении моделей отказоустойчивости, при подготовке мер восстановления и при согласовании требований гарантии, включая целевое время восстановления и целевую точку восстановления. В контексте управления информационной безопасностью FMEA полезен для анализа того, как сбои средств защиты или зависимостей приводят к нарушению конфиденциальности, целостности или доступности. Важно понимать границы: FMEA фокусируется на потенциальных сбоях и их эффектах, а не на детальном расследовании уже произошедших инцидентов или на поиске единственной коренной причины в рамках управления проблемами.
Answer
Нюансы
Частая ошибка — воспринимать FMEA как «табличку для аудита», которую заполняют один раз и забывают. В ITSM ценность метода появляется, когда результаты реально влияют на решения: приоритизацию улучшений, требования к мониторингу, резервированию, процедурам восстановления и правилам эскалации. Также FMEA нередко путают с управлением проблемами: управление проблемами обычно стартует от инцидентов и ищет причины, тогда как FMEA проактивен и рассматривает возможные сбои до того, как они проявились. Ещё одна ловушка — анализировать только технологические последствия (например, «сервер упал»), не поднимаясь до влияния на ИТ-услугу и бизнес-эффектов (например, «заказчик не может оформить заказ, нарушаются обязательства по уровню услуги»). Важно корректно выбрать уровень детализации: слишком крупные конфигурационные единицы скрывают реальные точки отказа, а чрезмерная детализация делает анализ дорогим и непрактичным. Наконец, не следует подменять FMEA оценкой риска целиком: FMEA даёт структурированное понимание цепочек последствий, но решения о допустимости риска и инвестициях должны приниматься в рамках управления рисками и управления непрерывностью услуг.
Answer
Примеры
  • Анализ последствий сбоя конфигурационной единицы «сервер базы данных»: от остановки транзакций до недоступности ИТ-услуги оформления заказов и потери выручки
  • Анализ режима сбоя «ошибка в конфигурации DNS»: влияние на доступность портала самообслуживания, рост обращений в сервис-деск и нарушение соглашения об уровне услуг
  • Анализ сбоя средства управления ключами шифрования: последствия для конфиденциальности данных, невозможность расшифровать резервные копии и усложнение восстановления
  • Анализ отказа канала связи к провайдеру облачных вычислений: влияние на достижение целевого времени восстановления и необходимость альтернативного маршрута
  • Анализ сбоя системы мониторинга: последствия для своевременной регистрации событий, задержки эскалации и роста длительности инцидентов
Courses
Рекомендуемые продукты по этой теме
 
 
Что такое анализ сбоев и последствий в ITIL и ITSM? Смотрите в глоссарии по управлению ИТ, входящим в бесплатную экспертную базу знаний по управлению ИТ от компании Cleverics.