Никакого пересказа ITIL, COBIT, ISO 20000, PRINCE2, TOGAF и прочего.
Только сведения от консультантов и тренеров Cleverics.
Только сведения от консультантов и тренеров Cleverics.
6160+
вопросов и ответов
25
авторов
440+
источников
100%
оригинальный контент
Основным показателем успешной реализации SLM является наличие и активная работа ответственных лиц за услугу с обеих сторон - со стороны заказчика и со стороны поставщика. Эти люди должны не просто формально присутствовать в процессе, но и демонстрировать реальное понимание своей ответственности, активно взаимодействовать между собой и способствовать достижению общих целей. Это является главным критерием, без которого другие элементы SLM не будут эффективны.
Для корректного применения метрики результативности необходимо соблюдение следующих условий: переназначение инцидентов должно использоваться только для функциональной эскалации, то есть передачи инцидентов на более высокий уровень экспертизы, а не для других целей (например, возврата на Service Desk при закрытии инцидента или последовательного выполнения работ разными группами). Также важно, чтобы при отказе пользователя от решения инцидент возвращался именно той группе, которая предоставила решение, а не перенаправлялся на другие группы (например, не на Service Desk).
Норма для системы определяется заранее при проектировании и зависит от того, как согласованы уровни обслуживания и технические спецификации. Например, в отказоустойчивых конфигурациях нормой может быть работа системы даже при выходе из строя некоторого количества компонентов. Это определяется в соглашениях об уровне обслуживания (SLA) и технических требованиях. Если система спроектирована так, что выход одного диска в RAID-массиве не влияет на работу, это становится частью нормы, и такой сбой не считается инцидентом. Таким образом, норма определяется не только текущим техническим состоянием, но и изначальными планами и требованиями к системе.
Не всегда возможно достичь 90% использования портала самообслуживания из-за различий в рабочих условиях сотрудников. Например, на производственных предприятиях, где сотрудники работают на линиях или с техникой, у них может не быть доступа к персональному компьютеру, но при этом они могут использовать специализированные системы и сканеры. Для таких сотрудников телефон остается самым удобным каналом связи с ИТ-поддержкой. Кроме того, в ситуациях, где работники часто меняются или у них низкая подготовка по ИТ, им может быть сложно самостоятельно пользоваться порталом, что снижает процент обращений через самообслуживание.
Да, одно и то же событие может быть инцидентом в одной ситуации и не быть им в другой, в зависимости от контекста и определения нормы. Например, выход из строя диска в RAID-массиве может не считаться инцидентом, если это предусмотрено конфигурацией и не приводит к снижению качества услуги. Но если аналогичный сбой происходит в другом месте системы, где отсутствует избыточность, это будет инцидентом. Решение о том, является ли событие инцидентом, зависит от того, как определена нормальная работа для конкретного компонента в конкретной среде.
Порядка 70% обращений поступает через портал и электронную почту, что позволяет пользователям описывать проблемы в более структурированном виде и прикладывать дополнительные материалы, например, скриншоты проблемных ситуаций. Оставшиеся 30% обращений приходят по телефону. Такое распределение каналов коммуникации создаёт условия для организации самообслуживания, так как пользователи уже привыкли не звонить, а писать сообщения, грамотно описывая свои проблемы. Это облегчает переход на систему, где пользователи могут самостоятельно классифицировать обращения и направлять их сразу ко второй линии поддержки.
Чтобы определить, является ли сбой RAID-массива инцидентом, нужно учитывать конкретную конфигурацию и условия, при которых массив считается работающим нормально. Например, в RAID 1+0 выход из строя одного диска в зеркале не считается инцидентом, если это не влияет на функциональность массива и его отказоустойчивость остается в допустимых пределах. Однако выход из строя второго диска в том же зеркале может привести к потере надежности и уже будет инцидентом. Важно определить, какие состояния являются нормальными для конкретной системы на основе технических спецификаций, и только после этого принимать решение о классификации происшествия.
Как пример с деловой игрой 'Проект Феникс' иллюстрирует возможность кратного ускорения в разработке?
Деловая игра 'Проект Феникс' демонстрирует, что кратное ускорение действительно возможно без смены персонала. На начальном этапе участники, работая как в обычных компаниях, показывают низкую эффективность: Time to Market составляет около 25 минут на задачу, а процент завершённых задач - 25-50%. К концу дня, после осознанного подхода к организации работы - правильной приоритизации задач, управлению потоком и внедрения ограничений на текущую работу - Time to Market снижается до 40 секунд - 1,5 минуты, а процент завершённых задач возрастает до 85-100%. Это подтверждает, что системные изменения в организации процессов, даже без изменения архитектуры и технологий (в рамках игры такие изменения невозможны), могут привести к ускорению в 15-25 раз.
Стандартизация помогает управлять рисками в ИТ-инфраструктуре через создание предсказуемых процессов, четких процедур и определенных ответственностей. Использование стандартов обеспечивает проверенные методы идентификации, оценки и минимизации рисков, что особенно важно для обеспечения непрерывности бизнеса и защиты информационных активов. Однако стандарты сами по себе не устраняют риски, а предоставляют структурированный подход к их управлению, который необходимо адаптировать к специфике организации.
Для оценки вероятности конечных событий через FTA необходимо следовать следующему алгоритму: собрать статистику по частоте возникновения базовых событий (на листьях дерева) – это могут быть данные об отказах оборудования, ошибок программного обеспечения или действий персонала; определить для каждого логического оператора формулу расчета вероятности: для оператора «И» вероятность события равна произведению вероятностей входящих событий, для оператора «ИЛИ» (при независимых событиях) – 1 минус произведение дополнений вероятностей; последовательно рассчитать вероятности по всем уровням дерева, начиная с базовых событий и поднимаясь к топ-событию. В случае сложных деревьев могут применяться программные инструменты для автоматизации расчетов. Полученная вероятность топ-события дает количественную оценку риска, которая может быть использована для сравнения с допустимыми уровнями риска и принятия решений об улучшении системы.