В редакцию портала поступил вопрос:
Помогите разобраться с ситуацией просчета показателя KPI как своевременность обработки и поиску доли вины по просроченным инцидентам. На вашем ресурсе я уже изучил статью, но остался ряд вопросов.
Представим ситуацию, когда был просрочен инцидент, и в процессе решения было несколько смен услуг и несколько смен групп ТП. SLA по услуге = OLA(Время 1ЛТП)+OLA(Гр ТП в зависимости от выбранной услуги).
Допустим, инцидент по первоначальной услуге надо было решить в срок 10 дней. 1ая Гр ТП была занята или просто приступила к решению на 5ый день. В итоге было установлено, что услуга выбрана не та и проблема не в её компетенции. Затем была произведена смена услуги. SLA по этой услуге составляет 2 дня. Т.е. у нас получается ситуация когда на следующую группу упал уже просроченный инцидент, так как SLA/OLA начинает свой отсчет с момента создания инцидента.
Вопросы:
- Как мы можем просчитать объективную долю своевременности обработки инцидента. Ведь первая Гр ТП действовала в рамках своего установленного времени OLA? По своему времени у них всё в порядке. Вести расчет R и W относительно времени SLA, по которому закрывался инцидент не совсем корректно. Как вариант, веса и рейтинги можно расчитывать относительно своего для каждой услуги и Гр ТП времени OLA. Т.е. сколько времени они удерживали инцидент.
- Как описано в примере выше, 2ая ГрТП получила уже просроченный инцидент, как по SLA, так и по своему времени OLA. Если поменять смысл OLA на следующий, что вне зависимости от того, менялась или нет услуга, SLA начинает свой отсчет от момента регистрации инцидента, и следующая группа может получить уже просроченный инцидент по SLA. Но время OLA при переназначении будет начинаться с момента переназначения, т.е. у группы будет оставаться своё регламентированное время на решение OLA. А расчет своевременности по просроченным инцидентам мы будем вести: 1. по просроченным инцидентам. 2. R и W будем высчитывать отностительно OLA1,OLA2… OLA N. В данном случае у нас получается. что общее время OLA выходит за пределы SLA по услуге. Хочется услышать мнение экспертов по данному поводу, ведь время OLA не может быть больше SLA.
Также можно рассмотреть другой взгляд на происходящее. В системе регистрации инцидентов, можно запретить изменение первичной услуги, а все возникающие вопросы по переназначению Гр ТП или услуг решать через связанные с инцидентом задачи. Тогда получается, что для каждой из услуг необходимо определить все возможные маршруты задач, т.е. все возможные задачи, которые могут появиться, чтобы гарантировать конечному пользователю фиксированное SLA.
Пример. У пользователя проблема с почтой (не отправляются письма). Заводится инцидент по услуге "Проблема почтового ПО", и в рамках инцидента создается первая задача для Гр ТП1 "проверка почтового ПО". Гр ТП1 устанавливает, что "проблема не связана с ПО". Далее в рамках инцидента создается задача 2 "Проверка сети", в ходе решения которой Гр ТП2 устанавливает, что это не проблема сети. Создается задача 3 "Проверка ПК" – инцидент закрывается.
В этом случае чтобы гарантировать Заявителю конечное время SLA, мы должны понять и определить какие дополнительные задачи могут возникнуть, чтобы просчитать и гарантировать финальное время SLA. SLA = OLA1+OLA2+…+OLA N. Но такой подход выглядит сложно реализуемым. Ваше мнение?
Вопрос: на сколько корректно менять бизнес-услугу по ходу решения инцидента? В примере меняется операционная услуга, ПО на Сеть.
Бизнес же услуга остается прежней "электронная почта", поэтому SLA по ходу решения меняться не будет.