Портал №1 по управлению цифровыми
и информационными технологиями

Бесплатная экспертная база знаний по управлению ИТ

 
Цикл мониторинга и контроля
 
Мониторинг выхода задачи, процесса, ИТ-услуги или конфигурационной единицы; сравнение этого выхода с заранее определённой нормой; и выполнение соответствующего действия на основе этого сравнения.
Answer
Оригинальный английский термин
monitor control loop
Answer
Подробности
Цикл мониторинга и контроля — это базовый механизм «замкнутого контура» в управлении услугами, который связывает наблюдение за фактическим состоянием с управленческим воздействием. В ITSM он используется для того, чтобы поддерживать стабильность и предсказуемость работы процессов и ИТ-услуг: мы измеряем выход (например, время отклика, количество ошибок, пропускную способность, заполнение дисков, успешность заданий), сопоставляем его с целевыми значениями или порогами и затем выполняем действие, возвращающее ситуацию в допустимые границы или предотвращающее ухудшение. Это может быть автоматическая реакция (скрипт, оркестрация, авто-масштабирование) или управляемая вручную реакция через сервис-деск и команды поддержки, включая регистрацию инцидента, запуск обходного решения или инициирование изменения. Цикл мониторинга и контроля применим не только к технологиям, но и к операционным процессам: например, контроль соблюдения сроков обработки запросов на обслуживание. Вне области этого термина находятся постановка самих норм и целей на уровне стратегии, согласование SLA, а также детальный анализ первопричин, характерный для управления проблемами; цикл отвечает за наблюдение, сравнение и реакцию, а не за долгосрочное улучшение дизайна.
Answer
Нюансы
Типичная ошибка — сводить цикл мониторинга и контроля только к «мониторингу». Мониторинг без заранее определённой нормы и без согласованного действия превращается в пассивное наблюдение и не является полноценным циклом. Другая путаница возникает с циклом обратной связи: оба основаны на сравнении факта с ожиданием, но цикл мониторинга и контроля ориентирован на операционную стабилизацию и удержание параметров в пределах, тогда как цикл обратной связи может применяться шире, включая улучшение продукта и услуг по откликам пользователей и заказчиков. Также часто неверно считать, что любое отклонение должно автоматически создавать инцидент: многие отклонения должны приводить к корректирующему действию без эскалации, либо к регистрации события для тренда. Важно избегать «дребезга» (частых переключений) из‑за плохо настроенных порогов и отсутствия гистерезиса; иначе контроль будет сам создавать нестабильность. Ещё один риск — неформализованная ответственность: если действие предполагает изменение, нужен корректный маршрут через управление изменениями и орган управления изменениями, иначе автоматизация может нарушить соответствие требованиям и целостность конфигурации. Наконец, норму нельзя выбирать произвольно: она должна опираться на базовое состояние, требования гарантии и полезности и реальные ограничения среды.
Answer
Примеры
  • Мониторинг времени отклика ИТ-услуги, сравнение с порогом из SLA и автоматическое переключение трафика на резервный компонент при превышении
  • Мониторинг заполнения дискового тома конфигурационной единицы, сравнение с нормой 80% и запуск очистки логов с последующей регистрацией события
  • Мониторинг успешности ночного задания (выход: статус выполнения), сравнение с ожидаемым «успешно» и создание инцидента при сбое с уведомлением команды поддержки
  • Мониторинг пропускной способности канала, сравнение с целевыми значениями и автоматическое масштабирование ресурсов в облачных вычислениях при устойчивой перегрузке
  • Мониторинг дрейфа конфигурации (сравнение фактических параметров с базовым состоянием) и инициирование корректирующего изменения при обнаружении отклонений
Courses
Рекомендуемые продукты по этой теме
 
 
Что такое цикл мониторинга и контроля в ITIL и ITSM? Смотрите в глоссарии по управлению ИТ, входящим в бесплатную экспертную базу знаний по управлению ИТ от компании Cleverics.