Своевременность реакции на назначение как KPI?

Опубликовано 2 февраля 2013

Рубрики: ITIL, ITSM, Измерение и оценка ИТ, Практика и опыт, Управление инцидентами

Комментарии

В процессе управления инцидентами есть очень важный показатель – своевременность реакции на инцидент в группе 2-ой и последующих линий. Его обязательно надо измерять и контролировать, особенно на раннем этапе работы по процессу, поскольку он позволяет выявлять задержки в обработке, связанные с отсутствием должного внимания к инцидентам руководителей функциональных групп. Напрашивается идея: сделать его KPI для руководителей групп. И я так делал, не один раз. Но думаю, в долгосрочной перспективе это может быть не очень хорошая идея. Почему?

Инциденты могут решаться долго не потому, что они очень сложные, а потому, что они долго лежат в очереди. Мы даже как-то обсуждали это не так давно. Время реакции на назначение важно измерять, потому что это одна из потенциальных причин задержек в обработке. Но чтобы эта метрика была показательной, инцидент в работу надо брать именно тогда, когда действительно приступаешь к его обработке. В то же время, если своевременность обработки является KPI для руководителей групп, они могут привыкнуть сами и приучить подчиненных брать в работу новые инциденты заранее. Пришел новый инцидент, кто-то берет его в работу, неважно, когда он к нему приступит, там разберемся. Зато время реакции красивое. Это маскирует проблему, а значит мешает её решать. Более того, можно показать, что такое поведение может привести к повышению среднего времени решения инцидентов (но об этом не сейчас). Поэтому для стабильного процесса своевременность реакции на назначение в качестве KPI для руководителей групп лучше не использовать.

С учетом сказанного попробуем сформировать KPI для руководителей функциональных групп, задействованных в поддержке. Основная метрика, естественно, своевременность решения (тут также возможны варианты, смотри здесь). В качестве tension-партнера можно использовать следующие варианты:

своевременность выполнения плановых работ. Это на самом деле здравая мысль – руководитель должен обеспечить баланс между тушением пожаров и выполнение плановых работ. Так появляется идея деления на 2-ю и 3-ю линии в пределах одного структурного подразделения (выделение фронта и бэка), так появляется стимул для выявления и устранения проблем;
долю инцидентов, зарегистрированных самостоятельно или по данным систем мониторинга, не дожидаясь обращений пользователей (если Вы хотите организовать своевременную регистрацию и действительно полезный мониторинг). И так далее.

Ну а скомбинировать эти метрики в итоговый KPI достаточно просто. Более того, практика показывает, что даже корень здесь лишний – обычное произведение прекрасно решает задачу 🙂

ИНТЕНСИВ С ТРЕНЕРОМ

VAP: Построение системы KPI для ИТ

Как обеспечить управление процессами, проектами, услугами, персоналом

Комментариев: 10

04.02.2013

Дмитрий, но ведь большую часть своей жизни инцидент, как правило проводит в очереди (среднее время от регистрации до выполнения в разы больше среднего же времени непосредственной работы над ним). Т.е. если мы говорим: “берём в работу только тогода, когда реально начинаем работать”, то имеем ситуацию, в которой допустимое время реакции приближается к плановому времени решения. С другой стороны, если реагировать заранее, можно сразу возвращать назад ошибочно направленные в группу инциденты, инициировать работы в смежных группах/линиях (если это необходимо).
Больше напрягает первый из озвученных моментов (время реакции стремится к плановому времени решения). Лично видел ситуации когда работник имеет некий норматив и он начинает им руководствоваться: если сказано что “упало, но в течении 15 минут поднялось по данным мониторинга” – работник мужественно ждёт 15 минут и только если “не поднялось” реагирует на инцидент, так же за руку ловил людей которые выполняли работы нормально, но для руководства демонстрировали “100%-ную загрузку” стабильно отмечая выполнение за несколько минут до крайнего срока.
- Ответить
- 04.02.2013
  
  Юрий, а как KPI на время приема в работу может решить озвученные Вами проблемы? Если учесть, что “Пришел новый инцидент, кто-то берет его в работу, неважно, когда он к нему приступит, там разберемся. Зато время реакции красивое”. Вы же не уберете ожидание в очереди, Вы его просто скроете, не так?
  Ответить
  - 04.02.2013
    
    Как минимум это стимул прочитать, осознать и, возможно, выполнить требуемые действия раньше. Опять же, чтобы понять что готов прямо сейчас взять инцидент в работу, необходимо прочитать его, а раз сотрудник уже открыл инцидент и понял, что именно он может/должен его решать, почему бы сразу не отметить его как “свой”: во-первых, экономим время других сотрудников на чтение этого же инцидента, во-вторых, избавляем его от повторного поиска “своего” инцидента в общей очереди группы.
    Да, граница между ожиданием и работой размывается, но зато время реакции улучшается не только “на бумаге” но и в жизни (пусть и не так сильно).
    Опять же у нас, например, чтобы инцидент попал на третью линию, он должен пройти и через первую, и через вторую. Если промежуточные линии не будут оперативно реагировать, добраться до третьей линии не оказавшись просроченным, у инцидента не так и много шансов.
    
    Ответить
    
    04.02.2013
    
    Юрий, так я же не писал, что это не надо измерять. Напротив: “Его обязательно надо измерять и контролировать…”. Но “…для стабильного процесса своевременность реакции на назначение в качестве KPI для руководителей групп лучше не использовать“.
    
    Ответить
    
    04.02.2013
    
    Дмитрий, если в результате получится более интересный комплексный показатель – готов взять его на вооружение и поделиться опытом использования.
    
    Ответить
- 04.02.2013
  
  «С другой стороны, если реагировать заранее, можно сразу возвращать назад ошибочно направленные в группу инциденты, инициировать работы в смежных группах/линиях (если это необходимо).»
  
  Вот это действительно важно. Но KPI на время реакции это вряд ли решится, а ответ можно искать где-то в этой области: http://www.realitsm.ru/2011/12/measuring-incident-management/. Во всяком случае, при применении таких метрик, у группы есть стимул не держать чужие инциденты у себя.
  Ответить
08.02.2013

Как вариант, можно в автоматизированной системе сделать ограничение: только один инцидент в статусе “В работе”. Сначала закрой (отложи, переадресуй и т.д. один, а затем берись за другой).
- Ответить
- 08.02.2013
  
  А как же ситуация, когда нужно дождаться пока отработает скрипт, применится политика и т.п? Ведь в это время можно взять следующий инцидент (опять таки не получим чистого времени выполнения, но эффективность выше, а это важнее). Переводить в данном случае в ожидание тоже не правильно: зачастую, когда инцидент переводится в ожидаение – пользователю отправляется соответствующее уведомление. Вводить новый статус (что-то типа “Ожидание без уведомления”) – усложнять жизнь специалистам.
  Да и вопрос Дмитрия был о KPI для руководителя группы.
  Ответить
08.02.2013

Не стоит всё воспринимать дословно. Я не рекомендую именно статус “Ожидание” и всё тут. Добавьте другой статус, как его назвать и делать ли оповещение вопрос для размышления. Назовите его “Технологическое выполнение”, например.
Усложнит ли это жизнь специалистам это вопрос к автоматизированной системе. Если придётся сделать 5 приседаний, одно отжимание и три оборота вокруг оси, чтобы сменить статус, то несомненно усложнит. Если сделать как-то более органично, чтобы, например, при приёме нового инцидента в работу предлагалось выбрать статус для предыдущего, то не особо.

Если ввести такое ограничение, это сделает показатель времени ожидания более объективным и позволит использовать в качестве KPI.

Хотя, конечно, придётся отслеживать чтобы не было приёма в работу, и тут же перевода в ожидание… Вобзщем-то тут как ен хитри, при желании всегда найдётся способ подогнать KPI к нужному значению.
- Ответить
01.09.2014

Есть старшие групп, ответственные сотрудники, которые назначают по матрице ответственности исполнителей по решению инцидентов.

Параметр, при котором учитывается интервал назначения инцидента на ответственного не учитываем. Один из важных значений для учета – нарушение сроков решения инцидента. Учитываем всё, включая сложные и простые, ведь 1 сложный может равняться 100 простым и статистика по кол-ву решенных практически не учитывается, если только при прочих равных.
- Ответить

Портал №1 по управлению цифровыми
и информационными технологиями

Своевременность реакции на назначение как KPI?

Комментариев: 10

Добавить комментарийОтменить ответ

Портал №1 по управлению цифровымии информационными технологиями

Также по теме:

Комментариев: 10

Добавить комментарийОтменить ответ

Портал №1 по управлению цифровыми
и информационными технологиями