Посетитель нашего портала Дмитрий задаёт следующий вопрос:
Коллеги, добрый день. Интересует как правильно связывать инциденты с затронутыми ими бизнес-сервисами.
Пример 1: клиент не смог перевести средства на счет телефона через интернет-банк и обратился в поддержку -> зарегестрировали инцидент с привязкой к бизнес сервису "Платежи и переводы в ИБ". Тут всё понятно.
Пример 2: Ответсвенный специалист обнаружил сбой в процессинговой системе (либо пришел алерт от системы мониторинга). Этот сбой влияет / может влиять не только на проведение платежей в ИБ, но на операции в банкоматах / ТСП / интернете и т.п.
– В данном случае, первая линия должна связять инцидент со всеми затронутыми / потенциально затронутыми бизнес-сервисами или каким-то одним, возможно самым важным?
– Реально ли первой линии понимать все взаимосвязи систем и бизнес-сервисов?
– Если представить, что пример 1 и пример 2 случились в одно время, то что делать с пользовательскими инцидентами (в которых выбраны конкретные затронутые бизнес-сервисы) и инцидентом, который был зарегестрирован ответсвенным / алертом (в котором выбрано несколько затронутых бизнес-сервисов). Их нужно связять? Какой делать главным? Как учитывать выбранные бизнес-сервисы во всех инцидентах? Поделитесь опытом в этой теме, пожалуйста.
Заводим инфраструктурный инцидент, связываем с "пострадавшими" ИТ-услугами. "Потенциально затронутые" – это какие? С отложенным влиянием? Классификацией инфраструктурных инцидентов у вас первая линия занимается?
Это зависит: квалификация, объём обращений, количество ИТ-услуг. Но на мой взгляд, скорее нет, чем да.
По пользовательскому инциденту нельзя однозначно сказать, что у нас за ситуация: произошёл локальный отказ у пользователя или глобальный в нашей инфраструктуре. Основным источником информации об отказах в инфраструктуре являются средства мониторинга, в т.ч. мониторинга бизнес-операций. Обращения пользователей служат определённым подтверждением произошедшего события, но не являются главным каналом получения информации об отказах услуг. А вот если мониторинга нет…
Пользовательский и инфраструктурный инциденты – разные объекты обработки. Они останутся порознь друг от друга. При этом однотипные пользовательские будут привязаны к вызвавшему их инфраструктурному, поскольку он является причиной, а они – следствием его возникновения.
В том смысле, как получить картинку по всем затронутым ИТ-услугам? После привязки инфраструктурных инцидентов к ИТ-услугам вывести общий список затронутых услуг в разбивке по каждому инфраструктурному инциденту.