Портал №1 по управлению цифровыми
и информационными технологиями

Бесплатная экспертная база знаний по управлению ИТ

 
Порог
 
Значение метрики, которое должно привести к формированию оповещения или к принятию управленческих действий. Например, «инцидент приоритета 1 не решён в течение 4 часов», «более 5 мягких ошибок диска за час» или «более 10 неуспешных изменений за месяц».
Answer
Оригинальный английский термин
threshold
Answer
Подробности
Порог — это заранее согласованное значение метрики, при достижении или превышении которого организация должна отреагировать: хотя бы создать оповещение для команды поддержки, а в ряде случаев — запустить конкретные действия управления. В ITSM пороги широко применяются в мониторинге и в практике управления мониторингом и событиями, чтобы переводить «сырые» наблюдения из рабочей среды в управляемые сигналы, требующие внимания. Порог может быть техническим (загрузка CPU выше 85% в течение 10 минут), сервисным (время восстановления услуги приближается к целевому времени восстановления) или управленческим (KPI по доле успешных релизов ниже целевого уровня). На практике пороги помогают связать измерение и отчётность с управлением инцидентами, управлением изменениями и управлением уровнем услуг: они определяют, когда нужно эскалировать, привлекать владельца услуги, инициировать разбор причин или корректировать график изменений. Вне охвата термина находятся причины отклонений и выбор конкретного обходного решения: порог лишь задаёт условие срабатывания, но не объясняет, почему метрика ухудшилась и как именно исправлять ситуацию.
Answer
Нюансы
Порог часто ошибочно воспринимают как «норму» или «цель», хотя это именно граница, при которой требуется реакция. Целевые значения KPI могут быть «амбициозными», а пороги — прагматичными, чтобы не перегружать команды поддержки и не создавать шум. Другая типичная путаница связана с тем, что срабатывание порога не равно инциденту: порог может породить оповещение и событие, но инцидент регистрируется, когда есть незапланированное прерывание услуги или снижение качества услуги. Аналогично, превышение порога по неуспешным изменениям не означает, что каждое изменение было «плохим» по задумке; важно отделять качество планирования и контроля от единичных сбоев. Распространённая ошибка — использовать статические пороги без учёта базового состояния, сезонности спроса и особенностей сервисного предложения; это приводит либо к пропуску реальных рисков, либо к «шторму» оповещений. Также недооценивают необходимость контекста: порог по инфраструктурной метрике должен быть связан с влиянием на услугу и требованиями гарантии, иначе команды оптимизируют цифры вместо ценности для заказчика.
Answer
Примеры
  • Загрузка файлового хранилища превысила 90% и держится более 30 минут, формируется оповещение для команды поддержки
  • Доля инцидентов, решённых в рамках SLA, опустилась ниже 95% за неделю, требуется управленческое действие со стороны владельца услуги
  • В рабочей среде зафиксировано более 5 ошибок аутентификации подряд для одного пользователя, формируется оповещение для проверки возможного нарушения информационной безопасности
  • Более 10 неуспешных изменений за календарный месяц, инициируется анализ в рамках управления изменениями и управление рисками
Courses
Рекомендуемые продукты по этой теме
 
 
Что такое порог в ITIL и ITSM? Смотрите в глоссарии по управлению ИТ, входящим в бесплатную экспертную базу знаний по управлению ИТ от компании Cleverics.