Никакого пересказа ITIL, COBIT, ISO 20000, PRINCE2, TOGAF и прочего.
Только сведения от консультантов и тренеров Cleverics.
Только сведения от консультантов и тренеров Cleverics.

6170+
вопросов и ответов

25
авторов

440+
источников

100%
оригинальный контент
В ITIL проблема — это причина или потенциальная причина одного или нескольких инцидентов, тогда как инцидент — это сам факт незапланированного прерывания услуги. Пример: если пользователь не может распечатать документ (инцидент), то проблемой может быть конфликт драйвера сетевого принтера с диспетчером печати Windows, который привел к этому инциденту. Проблема требует анализа для выявления корневой причины, чтобы предотвратить повторение инцидентов.
Value Streams в IT4IT и процессы ITIL v3 имеют прямое соответствие, хотя и структурированы по-разному. В IT4IT определены четыре основных Value Stream'a: Strategy to Portfolio (S2P), Requirement to Deployment (R2D), Request to Fulfill (R2F) и Detect to Correct (D2C). Каждый Value Stream состоит из нескольких функциональных компонентов. Например, Value Stream 'Request to Fulfill' включает в себя функциональные компоненты, которые непосредственно соответствуют множеству процессов из ITIL v3, таких как управление запросами, управление инцидентами, управление проблемами и управление уровнями услуг. Аналогично, Value Stream 'Detect to Correct' соотносится с процессами управления непрерывностью и доступностью. Таким образом, хотя IT4IT объединяет процессы в более крупные потоки создания ценности, практические функции и действия, описанные в этих потоках, совпадают с процессами ITIL v3.
При изменении процесса управления изменениями следует учитывать: уровень сложности инфраструктуры компании и ее распределенность, количество и типы участвующих сторон (собственные команды, подрядчики, аутсорсинг), роль управляемых систем в бизнес-процессах (являются ли они фактором дифференциации), соотношение затрат на управление и получаемую выгоду. Также важно определить, находится ли организация в области 'Запутанно' или 'Сложно' по модели Cynefin, так как в условиях высокой сложности традиционные методы контроля становятся менее эффективными и целесообразнее действовать через эксперименты.
Менеджер процесса управления уровнем услуг обеспечивает операционное управление процессом. Его обязанности включают планирование и координацию всех активностей процесса в соответствии с политиками и регламентами, назначение исполнителей на роли, непосредственное управление этими исполнителями, мониторинг и отчётность по работе процесса. Также он отвечает за взаимодействие с владелецами услуг и менеджерами других процессов для обеспечения качественного предоставления услуг. В контексте SLA менеджер процесса не только обеспечивает их наличие, но и участвует в обсуждении и согласовании требований к уровню услуг с заказчиком и подготовке самих соглашений.
Наиболее эффективными методами для предотвращения инцидентов являются глубокий анализ корневых причин проблем, регулярные аудиты бизнес-процессов, внедрение четких процедур распределения ответственности и взаимодействия между сотрудниками, а также непрерывный мониторинг и документирование опыта решения предыдущих инцидентов. Важно не ограничиваться техническими аспектами и учитывать организационные моменты, такие как коммуникация и процессы принятия решений, что позволяет выявлять потенциальные проблемы до их возникновения и предотвращать их появление.
Менеджеры процесса должны отслеживать метрики, отражающие эффективность всего процесса: время прохождения процесса (cycle time), количество ошибок или повторных работ (defect rate), удовлетворенность заказчика результатом процесса, затраты на выполнение процесса, соблюдение сроков этапов, коэффициент использования ресурсов. Важно, чтобы KPI были сквозными и оценивали не отдельные подразделения, а результат всего процесса, так как это позволяет менеджеру процесса сосредоточиться на улучшении целостной работы, а не на локальной оптимизации отдельных частей.
Микросервисная архитектура по-разному влияет на развитие и эксплуатацию программного обеспечения. В части развития она обеспечивает гибкость, возможность раннего прототипирования, тестирования и повышения отказоустойчивости системы. Команды могут быстро внедрять изменения в отдельные сервисы без перезапуска всей системы. Однако в части эксплуатации микросервисы создают дополнительную сложность из-за множества взаимодействующих компонентов, что требует тщательного управления конфигурациями, зависимостями и мониторингом. Без правильных процессов поддержки система может стать неуправляемой, переходя в сложный домен, где диагностика и исправление проблем значительно усложняются и становятся дорогостоящими.
Согласно ITIL 4, при формировании сервисного предложения (service offering) используются три типа сущностей: 1. Товары (goods) – то, что передаётся потребителю, после чего сам потребитель отвечает за их использование (например, wifi-маршрутизатор в подарок при подключении домашнего интернета). 2. Доступ к ресурсам – ресурсы, к которым получает доступ потребитель (например, сеть, к которой подключается абонент, или почтовый/прокси/p2p сервер). 3. Сервисные операции (service actions) – деятельность, выполняемая представителями поставщика, потребителя или ими совместно (например, взаимодействие со службой поддержки). Эти три типа сущностей позволяют комплексно описать то, что поставщик услуги предлагает потребителю.
Самым критичным уровнем влияния при оценке инцидентов считается ситуация, когда ИТ-услуга полностью недоступна для всего отдела или компании в целом. Такой уровень влияния обычно присваивается инцидентам, приводящим к полной остановке ключевых бизнес-процессов организации. Такие инциденты требуют немедленного решения и обычно имеют минимальные нормативные сроки устранения согласно SLA. Данный уровень влияния находится в верхней части иерархии приоритетов и предполагает задействование максимального количества ресурсов для быстрого восстановления работоспособности системы.
В ITIL проблема определяется как корневая причина одного или нескольких инцидентов, но не обязательно множественных. Даже единичный инцидент с высоким бизнес-воздействием (например, остановка платежной системы на час) требует анализа проблемы, так как его повторение недопустимо. Кроме того, управление проблемами включает работу с потенциальными рисками, выявленными без привязки к реальным инцидентам, например, через анализ тенденций в ИТ-инфраструктуре.