| Перейти к полной базе знаний Перейти к полному глоссарию | |
Анализ сбоев услуги | |
Деятельность, которая выявляет глубинные причины одного или нескольких прерываний ИТ-услуги. SFA выявляет возможности улучшить процессы и инструменты поставщика услуги, а не только ИТ-инфраструктуру. SFA является ограниченной по времени, похожей на проект деятельностью, а не непрерывным процессом анализа. | |
![]() | Оригинальный английский термин service failure analysis |
![]() | Подробности Анализ сбоев услуги — это целенаправленная, ограниченная по времени работа, проводимая после одного или нескольких серьёзных прерываний ИТ-услуги, чтобы понять, почему сбой произошёл и что нужно изменить, чтобы он не повторялся. В отличие от подхода «починили и забыли», анализ рассматривает услугу целиком: как она проектируется, как выполняется предоставление и поддержка, как устроены процедуры, как используются инструменты мониторинга и какие решения принимаются в рамках управления изменениями. В практическом применении анализ сбоев услуги часто инициируют после крупного инцидента или серии повторяющихся инцидентов, когда требуется быстро собрать факты, выявить системные слабые места и согласовать улучшения с владельцем услуги и командами поддержки. Результатом обычно становятся конкретные инициативы по совершенствованию: корректировки моделей изменения, доработки автоматизации, уточнение ролей, улучшение измерения и отчётности, повышение наблюдаемости услуги. Вне области применения анализа сбоев услуги находится оперативное восстановление услуги и обработка пользовательских обращений в момент инцидента, а также бесконечный, постоянный анализ «вообще всего» без временных рамок и чётко определённого результата. |
![]() | Нюансы Частая ошибка — считать анализ сбоев услуги синонимом управления проблемами. Управление проблемами — это практика, которая может работать непрерывно и охватывать широкий портфель проблем, включая известные ошибки и обходные решения; анализ сбоев услуги, напротив, обычно запускают как отдельную, ограниченную по времени инициативу вокруг конкретных прерываний ИТ-услуги. Его также путают с «разбором полётов» после инцидента: разбор может закончиться фиксацией хронологии, а анализ сбоев услуги должен выявлять возможности улучшить процессы и инструменты поставщика услуги, а не ограничиваться технической причиной в ИТ-инфраструктуре. Ещё одна ловушка — чрезмерно узкий фокус на «виноватой» конфигурационной единице, игнорируя, например, неудачную модель изменения, недостаточную валидацию и тестирование или слабый мониторинг. Важно отделять выводы от предположений: опираться на факты из записей об инцидентах, данных мониторинга и событий, а также на информацию из CMDB, если она используется. Наконец, анализ сбоев услуги часто проваливается из-за отсутствия владельца улучшений: без привязки к постоянному совершенствованию результаты превращаются в отчёт, который не меняет ни процесс, ни инструменты. |
![]() | Примеры
|
![]() | Рекомендуемые продукты по этой теме |
|
| |
Что такое анализ сбоев услуги в ITIL и ITSM? Смотрите в глоссарии по управлению ИТ, входящим в бесплатную экспертную базу знаний по управлению ИТ от компании Cleverics. | |




