Портал №1 по управлению цифровыми
и информационными технологиями

Бесплатная экспертная база знаний по управлению ИТ

 
Практика управления проблемами
 
Практика снижения вероятности и влияния инцидентов за счёт выявления фактических и потенциальных причин инцидентов, а также управления обходными решениями и известными ошибками.
 
Синонимы
управление проблемами
Answer
Оригинальный английский термин
problem management practice
Answer
Подробности
Практика управления проблемами направлена на то, чтобы не только устранять последствия сбоев, но и системно предотвращать их повторение и уменьшать ущерб, который они наносят услугам. В повседневной работе она начинается там, где управление инцидентами уже восстановило услугу или стабилизировало ситуацию, но остаётся необходимость разобраться в причинах и исключить повторяемость. Для этого анализируются тренды инцидентов, корреляции событий мониторинга, изменения в среде, ошибки конфигурации и слабые места в компонентах и процессах. Результатом может быть выявленная причина, оформленная как известная ошибка, и согласованное обходное решение, позволяющее команде поддержки быстрее восстанавливать услугу до внедрения постоянного исправления через управление изменениями. Практика особенно полезна в организациях с высокой критичностью ИТ-услуг, большим потоком обращений в сервис-деск и сложной ИТ-инфраструктурой, где повторяющиеся инциденты создают значительные затраты и риск для заказчика. Вне её области — обработка единичных запросов на обслуживание, предоставление доступа, обучение пользователей и реализация улучшений без привязки к причинам инцидентов; эти задачи могут выполняться другими практиками, хотя и использовать результаты управления проблемами.
Answer
Нюансы
Практику управления проблемами часто ошибочно сводят к «поиску виноватых» или к разбору каждого инцидента. На деле фокус — на управлении риском повторения и снижении влияния инцидентов, поэтому не каждый инцидент должен приводить к проблеме: приоритет получают повторяющиеся, крупные инциденты и ситуации с высоким потенциальным ущербом. Другая типичная путаница возникает между проблемой и инцидентом: инцидент — это нарушение услуги здесь и сейчас, а проблема — причина или потенциальная причина одного или нескольких инцидентов; устранение инцидента не означает устранения проблемы. Ещё одно распространённое искажение — считать обходное решение «плохой практикой»; в реальности управляемые обходные решения критичны для быстрого восстановления услуги и должны быть известны сервис-деск и командам поддержки, но при этом важно не зафиксироваться на них навсегда и не накапливать технический долг. Также нередко воспринимают известную ошибку как «баг в коде»; в ITSM это шире: известная ошибка — подтверждённая причина инцидентов (включая конфигурацию, интеграции, операционные процедуры) с документированным обходным решением или планом устранения. Опасная крайность — проводить глубокий анализ причин без достаточных данных или без экономического обоснования, теряя скорость организации и не улучшая ценность для заказчика.
Answer
Примеры
  • После нескольких инцидентов с падением производительности выявлена причина в некорректных настройках пула соединений; зафиксирована известная ошибка и обходное решение — временно ограничить число параллельных запросов до релиза с исправлением
  • Повторяющиеся инциденты «нет доступа к общей папке» приводят к анализу причин: просроченные записи в группах AD; оформлено обходное решение для сервис-деск и инициировано изменение в процедуре управления доступами
  • Серия крупных инцидентов при плановых работах приводит к выявлению потенциальной причины: отсутствие валидации и тестирования на тестовой среде для определённого типа изменений; определены корректирующие действия и критерии предотвращения повторения
  • Инциденты с разрывом VPN у удалённых пользователей анализируются и связываются с конкретной версией драйвера; зарегистрирована известная ошибка и рекомендован откат версии как обходное решение до поставки обновления
  • Периодические сбои интеграции с платёжным шлюзом приводят к анализу логов и выявлению таймаутов из‑за сетевой маршрутизации; создано обходное решение по переключению на резервный маршрут и подготовлен RFC на постоянное исправление
Courses
Рекомендуемые продукты по этой теме
 
 
Что такое практика управления проблемами в ITIL и ITSM? Смотрите в глоссарии по управлению ИТ, входящим в бесплатную экспертную базу знаний по управлению ИТ от компании Cleverics.