Портал №1 по управлению цифровыми
и информационными технологиями

Бесплатная экспертная база знаний по управлению ИТ

 
Управление событиями
 
Процесс, отвечающий за управление событиями на протяжении их жизненного цикла. Управление событиями — одна из основных деятельностей ИТ-операций.
Answer
Оригинальный английский термин
event management
Answer
Подробности
Управление событиями — это процесс эксплуатационного уровня, который обеспечивает систематическую работу с событиями: от их выявления средствами мониторинга до принятия решения о реакции и закрытия. Событие в ITSM обычно означает значимое изменение состояния сервиса, компонента ИТ-инфраструктуры или приложения, которое требует регистрации, анализа и, при необходимости, действий. На практике управление событиями помогает поддерживать стабильное предоставление ИТ-услуг, повышая наблюдаемость рабочей среды и сокращая время обнаружения отклонений. Процесс включает настройку источников событий и правил, фильтрацию «шума», классификацию и приоритизацию, маршрутизацию в команду поддержки или сервис-деск, а также эскалацию при риске нарушения уровня услуги. Результатом может быть автоматическое восстановление, создание инцидента для восстановления услуги, инициирование запроса на изменение для устранения системного дефекта или накопление данных для анализа тенденций. Вне области охвата управления событиями находятся детальное восстановление услуги как таковое (это зона управления инцидентами), поиск и устранение первопричины (управление проблемами), а также согласование и авторизация изменений (управление изменениями), хотя управление событиями часто выступает источником входных данных для этих процессов.
Answer
Нюансы
Частая ошибка — смешивать управление событиями с управлением мониторингом и событиями как практикой: практика шире и включает принципы, роли, метрики, инструменты и улучшения, тогда как управление событиями здесь описывает именно процессовую работу со событиями в жизненном цикле. Также нередко путают событие и инцидент: событие может быть информационным и не требовать действий, тогда как инцидент — это нарушение или снижение качества ИТ-услуги, требующее восстановления. Опасное упрощение — превращать управление событиями в «фабрику тикетов», когда каждое событие автоматически создаёт инцидент: это перегружает сервис-деск и команду поддержки, снижает скорость реакции на действительно важные сигналы и ухудшает качество данных для измерения и отчётности. Другой типичный провал — отсутствие корреляции и базового состояния, что ведёт к «штормам» событий при массовых сбоях и к ложным срабатываниям из-за неверных порогов. Важно помнить, что управление событиями не заменяет управление проблемами: повторяющиеся события могут указывать на известную ошибку и требовать обходного решения, но решение первопричины должно оформляться и управляться отдельно. Наконец, события, связанные с изменениями, нужно интерпретировать с учётом графика изменений, иначе нормальные последствия развёртывания будут восприниматься как сбои.
Answer
Примеры
  • Событие мониторинга сообщает о падении доступности API; правило корреляции создаёт один инцидент для восстановления ИТ-услуги вместо десятков уведомлений по компонентам
  • Событие «свободное место на диске ниже порога» автоматически запускает очистку временных файлов; при неуспехе выполняется эскалация в команду поддержки
  • Событие «сбой задания резервного копирования» классифицируется как предупреждение и направляется ответственным, чтобы предотвратить будущий инцидент при восстановлении
  • Событие «сетевой интерфейс недоступен» сопоставляется с графиком изменений; при совпадении помечается как ожидаемое и не эскалируется
  • События множественных неудачных попыток входа агрегируются и передаются в управление информационной безопасностью для анализа риска
Courses
Рекомендуемые продукты по этой теме
 
 
Что такое управление событиями в ITIL и ITSM? Смотрите в глоссарии по управлению ИТ, входящим в бесплатную экспертную базу знаний по управлению ИТ от компании Cleverics.