В процессе управления инцидентами есть очень важный показатель – своевременность реакции на инцидент в группе 2-ой и последующих линий. Его обязательно надо измерять и контролировать, особенно на раннем этапе работы по процессу, поскольку он позволяет выявлять задержки в обработке, связанные с отсутствием должного внимания к инцидентам руководителей функциональных групп. Напрашивается идея: сделать его KPI для руководителей групп. И я так делал, не один раз. Но думаю, в долгосрочной перспективе это может быть не очень хорошая идея. Почему?
Инциденты могут решаться долго не потому, что они очень сложные, а потому, что они долго лежат в очереди. Мы даже как-то обсуждали это не так давно. Время реакции на назначение важно измерять, потому что это одна из потенциальных причин задержек в обработке. Но чтобы эта метрика была показательной, инцидент в работу надо брать именно тогда, когда действительно приступаешь к его обработке. В то же время, если своевременность обработки является KPI для руководителей групп, они могут привыкнуть сами и приучить подчиненных брать в работу новые инциденты заранее. Пришел новый инцидент, кто-то берет его в работу, неважно, когда он к нему приступит, там разберемся. Зато время реакции красивое. Это маскирует проблему, а значит мешает её решать. Более того, можно показать, что такое поведение может привести к повышению среднего времени решения инцидентов (но об этом не сейчас). Поэтому для стабильного процесса своевременность реакции на назначение в качестве KPI для руководителей групп лучше не использовать.
С учетом сказанного попробуем сформировать KPI для руководителей функциональных групп, задействованных в поддержке. Основная метрика, естественно, своевременность решения (тут также возможны варианты, смотри здесь). В качестве tension-партнера можно использовать следующие варианты:
- своевременность выполнения плановых работ. Это на самом деле здравая мысль – руководитель должен обеспечить баланс между тушением пожаров и выполнение плановых работ. Так появляется идея деления на 2-ю и 3-ю линии в пределах одного структурного подразделения (выделение фронта и бэка), так появляется стимул для выявления и устранения проблем;
- долю инцидентов, зарегистрированных самостоятельно или по данным систем мониторинга, не дожидаясь обращений пользователей (если Вы хотите организовать своевременную регистрацию и действительно полезный мониторинг). И так далее.
Ну а скомбинировать эти метрики в итоговый KPI достаточно просто. Более того, практика показывает, что даже корень здесь лишний – обычное произведение прекрасно решает задачу 🙂
Дмитрий, но ведь большую часть своей жизни инцидент, как правило проводит в очереди (среднее время от регистрации до выполнения в разы больше среднего же времени непосредственной работы над ним). Т.е. если мы говорим: “берём в работу только тогода, когда реально начинаем работать”, то имеем ситуацию, в которой допустимое время реакции приближается к плановому времени решения. С другой стороны, если реагировать заранее, можно сразу возвращать назад ошибочно направленные в группу инциденты, инициировать работы в смежных группах/линиях (если это необходимо).
Больше напрягает первый из озвученных моментов (время реакции стремится к плановому времени решения). Лично видел ситуации когда работник имеет некий норматив и он начинает им руководствоваться: если сказано что “упало, но в течении 15 минут поднялось по данным мониторинга” – работник мужественно ждёт 15 минут и только если “не поднялось” реагирует на инцидент, так же за руку ловил людей которые выполняли работы нормально, но для руководства демонстрировали “100%-ную загрузку” стабильно отмечая выполнение за несколько минут до крайнего срока.