В редакцию портала поступил вопрос:
Добрый день!
Кейс с организацией on-call дежурств для L3 команд. В IT департаменте организации сложилось так, что в L3 командах, которые отвечают за критичные для компании сервисы (сетевая инфраструктура, серверное оборудование, системы версионирования и т.д.) работают по 2 человека в каждой команде (сетевые админы, инфраструктурные админы, атлассиан админы и др.). В обычное рабочее время (8 на 5) идаже с учетом отпусков и больничных этой численности хватает для решения задач.
Но есть необходимость организовать on-call дежурства 24 на 7 по обработке инцидентов по некоторым самым критичным сервисам. Процесс выглядит так что от системы мониторинга поступают алерты, поступает звонок в L1, далее L2 при необходимости, далее L3 тоже при необходимости. При этом на всех уровнях — это именно дежурство по телефону (ответить на звонок), то есть это не полноценная работа 24 на 7.
С L1 и L2 командами в этом плане все ок, у них численность побольше, но с L3 — есть вопросы, т.к. сотруднику придется пол месяца условно быть в on-call, хоть инциденты случаются очень редко, тем не менее это все-равно накладывает какие-то ограничения для сотрудника и они сопротивляются такому подходу. Найм в команды L3 сотрудников рассматривается, но пока очень спорный, т.к. тогда не хватает загрузки для дорогих специалистов в обычное время. Также рассматриваем возможность доп мотивации сотрудников за on-call дежурства в различных видах.
Думаю это не очень уникальный кейс и буду признателен за то, что набросаете варианты решения по нему.
Я так понимаю, что на L3 эскалируют обращения не так часто, а только тогда, когда L1 и L2 не смогли с ними справиться. При такой загрузке нет необходимости держать постоянно в смене 2 человека на L3. Можно организовать консьерж- сервис, или при 24/7 – “ночной портье” (сторож), который при необходимости может привлекаться для выполнения работ (они ведь не часто случаются?). Это разгрузит привлечение персонала, которое есть сейчас.
Или организовать Сворминг (роение), если есть необходимость, но не держать полную смену на L3.