Портал №1 по управлению цифровыми
и информационными технологиями

Бесплатная экспертная база знаний по управлению ИТ

 
Анализ дерева отказов
 
Техника, которую можно использовать для определения цепочки событий, приводящей к проблеме. Анализ дерева отказов представляет цепочку событий с использованием булевой нотации на диаграмме.
 
Синонимы
FTA
Answer
Оригинальный английский термин
fault tree analysis, FTA
Answer
Подробности
Анализ дерева отказов — это метод структурированного поиска причинно-следственных связей, который помогает понять, как комбинации сбоев, ошибок, внешних условий и действий людей могут привести к нежелательному результату, обычно к проблеме или значимому нарушению услуги. В ITSM его применяют в управлении проблемами, при расследовании крупных инцидентов и для проактивного управления рисками, когда важно не просто найти один «виноватый» элемент, а увидеть, какие сочетания событий создают уязвимость. Диаграмма строится сверху вниз: вверху фиксируется конечное нежелательное событие, ниже раскладываются возможные причины, соединённые логическими связками И/ИЛИ, что позволяет моделировать сценарии отказа и оценивать, какие ветви критичны. Практическая ценность метода в том, что он делает сложные зависимости прозрачными для совместной работы команд поддержки, владельца услуги и инженеров, а результаты можно использовать для выбора корректирующих действий, улучшений в мониторинге и изменений в проектировании. При этом анализ дерева отказов не предназначен для описания процесса устранения инцидента в реальном времени или для ведения базы знаний; он также не заменяет управление изменениями и не является универсальным инструментом для расчёта производительности.
Answer
Нюансы
Частая ошибка — воспринимать анализ дерева отказов как поиск единственной первопричины. На практике «верхнее событие» нередко возникает только при сочетании нескольких факторов, и булева логика как раз нужна, чтобы показать, когда причины работают совместно (И), а когда альтернативно (ИЛИ). Ещё одно заблуждение — подменять им управление проблемами: анализ дерева отказов является техникой, а не процессом, и сам по себе не обеспечивает регистрацию, приоритизацию и контроль выполнения корректирующих действий. Его также путают с анализом первопричин в общем смысле; отличие в том, что дерево отказов ориентировано на моделирование логических комбинаций событий и на полноту рассмотрения ветвей, а не только на ретроспективное объяснение уже случившегося. Важно не смешивать уровни: события на диаграмме должны быть сформулированы проверяемо и однозначно, иначе дерево превращается в набор предположений, непригодных для подтверждения данными мониторинга. Наконец, чрезмерная детализация может снизить ценность: дерево должно быть достаточно глубоким, чтобы выявлять управляемые точки воздействия, но не уходить в микропричины, которые не приводят к практическим улучшениям услуги или снижению риска.
Answer
Примеры
  • Недоступность ИТ-услуги «Интернет-банк» разложена на ветви: отказ балансировщика ИЛИ одновременный сбой двух узлов кластера И перегрузка пула соединений
  • Сбой развёртывания релиза моделируется как сочетание: ошибка в конфигурации И отсутствие валидации в тестовой среде И недостаточные права у автоматизированного аккаунта
  • Потеря данных в приложении представлена как: сбой хранилища И отказ репликации И отсутствие актуального восстановления до целевой точки восстановления
  • Повторяющиеся ошибки авторизации пользователей описаны как: рассинхронизация времени на контроллерах домена И строгая политика токенов И задержки сети до филиалов
Courses
Рекомендуемые продукты по этой теме
 
 
Что такое анализ дерева отказов в ITIL и ITSM? Смотрите в глоссарии по управлению ИТ, входящим в бесплатную экспертную базу знаний по управлению ИТ от компании Cleverics.