Портал №1 по управлению цифровыми
и информационными технологиями

Ключевые практики управления доступностью и непрерывностью

Последнее время меня занимает вопрос оценки процесса управления доступностью и непрерывностью ИТ-услуг. И если с измерением результативности процесса, на мой взгляд, все более или менее понятно – она определяется степенью достижения согласованных показателей доступности и непрерывности услуг[1], то с измерением ключевых практик не все однозначно.

Собственно, вопросы есть уже к списку ключевых практик, которые необходимы для реализации назначения процесса. Здесь необходимо сделать оговорку, что я рассматриваю вариант ISO/IEC 20000, согласно которому управление доступностью и непрерывностью совмещены. Однако суть упражнения не поменяется и при разделении процессов. С оглядкой на ITIL и COBIT5 Enabling Processes получается следующий список ключевых практик:

  1. Планирование доступности и непрерывности на основе требований бизнеса

Раз уж мы должны обеспечить согласованный уровень доступности, он должен быть определен и документирован в SLA, а кроме того явно задана граница доступности и недоступности (об этом я писал в заметке про критерий доступности). Возможная метрика, которая покажет успехи в этом направлении: полнота определения требований и критериев доступности по ИТ-услугам.

Ключевое значение на способность предприятия реагировать на ЧС и восстанавливать критические ИТ-услуги является наличие документированных процедур по реагированию, восстановлению и возврату к штатному функционированию ИТ-услуг (планов непрерывности). В отсутствии таковых рассчитывать на восстановление в соответствии с RTO и RPO практически не приходится. С точки зрения планирования непрерывности важно обеспечить надлежащий охват, как правило, критичных услуг/VBF планами непрерывности. Возможная метрика: полнота покрытия критичных ИТ-услуг/VBF планами непрерывности.

Наконец, как на стороне бизнеса, так и на стороне ИТ регулярно проходят изменения, требующие актуализации планов непрерывности. Чем дольше задержка актуализации планов, тем выше риски, что в случае наступления ЧС и активации  планов что-то пойдет не так. Поэтому время, в течение которого необходимо провести актуализацию планов, должно быть ограничено (например, до конца рабочего дня или в течение 8 рабочих часов). Отсюда – метрика своевременности актуализации планов непрерывности.

  1. Снижение рисков нарушения доступности

Важной частью процесса является сбор и анализ данных по доступности, выявление тенденций, оценка рисков и разработка мер по сокращению потерь в результате отказов ИТ-услуг. Есть ли от этого толк, покажет уровень доступности, анализируемый в динамике. А в рамках оценки ключевой практики могут контролироваться идентифицированные неприемлемые риски, в отношении которых не ведется работа по снижению.

Если очень повезло и в организации ведется учет понесенного ущерба в результате отказов, ключевая практика может быть переименована в «Рациональное снижение рисков нарушения доступности ИТ-услуг» и появится новая область для оценки – экономическая эффективность реализованных мер.

  1. Проведение регулярных тестирований механизмов обеспечения доступности и непрерывности

Для того чтобы с одной стороны повысить, а с другой – проверить готовность ИТ-организации обеспечивать необходимый уровень доступности и непрерывности, согласно заранее составленному расписанию (как правило, на год) проводятся учения/тестирования. Очевидно, что такие учения должны: а) проводится своевременно, в соответствии с планом-графиком; б) как можно чаще, особенно по критичным ИТ-услугам. Отсюда метрики: своевременность проведения учений, полнота проводимых учений.

Вроде набор правильный, но есть чувство недосказанности. Или нет? Буду признателен за фидбек.


[1] При этом, конечно, определение алгоритма агрегирования, который позволит получать адекватный интегральный показатель задача вовсе не тривиальная, особенно в условиях десятков услуг разной критичности, набор согласованных показателей по которым различен.

Учебные курсы и сертификация
специалистов по ИТ-менеджменту

Комментариев: 2

  • Anton Boganov

    У меня появляется чувство недостаточности от того, что процессы управления доступностью и непрервывностью не опираются или не выливаются в сами технологии их обеспечения. От наличия регламента, прописывающего проведение учений или оценку рисков, производительность и непрерывность, а значит и доступность, лучше не станут! Как счаитаете, важно ли смотреть на архитектуру ИТ-услуги?

    • Не уверен, что до конца понял вопрос. 

      Если речь идет об учете фактического уровня доступности/непрерывности, то он безусловно окажет влияние на метрики результативности процесса (первый абзац заметки).

      Или же речь о том, что в наборе ключевых практик нужно предусмотреть, например, "Устранение единых точек отказа" и ввести метрику, с помощью которой можно будет отслеживать успехи?


Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

  • Рубрики

  •  
  • Авторы

  •  
  • Самое свежее

    • VI форум «Управление данными — 2021»: наведите порядок в данных!
      23 сентября 2021 года издательство «Открытые системы» в шестой раз проведет в Москве масштабный форум «Управление данными — 2021», объединяющий всех, кто определяет стратегию работы с данными, воплощает ее в жизнь и управляет предприятием на основе объективных достоверных данных. Участники форума обсудят не только инновационные стратегии и бизнес-модели работы с корпоративными данными, но и конкретные архитектурные и технологические решения.
    • Простые уловки, как ускорить процесс разработки программного обеспечения
      С некоторыми вещами люди из бизнеса вынуждены соглашаться, и одна из них заключается в том, что никто не хочет сердить свою команду разработчиков. Часто они являются краеугольным
    • Почему каждая инициатива DevOps должна начинаться с оценки возможностей
      Внедрение практики DevOps идет полным ходом. Организации сосредоточены на том, как внедрить возможности DevOps в командах и как масштабировать DevOps в масштабах предприятия. Но важным аспектом любого пути масштабной трансформации является оценка возможностей команды или организации на этом пути.
    • Что такое процесс и что такое практика в ITIL®4
      Продолжаем публиковать короткие видеоролики, посвященные актуальным вопросам управления ИТ. Сегодня поговорим о том, что такое процесс и что такое практика в ITIL4. Это не переименование процессов в практики, это два отдельных понятия. Рассказывает Игорь Фадеев, ITIL 4 Managing Professional и ITIL 4 Strategic Leader, аккредитованный тренер по ITIL4.
    • Аудит. Что может быть скучнее?!
      На прошедшей неделе участвовал в аудите (в качестве объекта аудита). Большинство людей, проходивших аудит, подозреваю, разделяет это ощущение: «Бюрократия, формальности и т.п.»
    • Как технический долг вредит вашей команде программистов — и вашей безопасности приложений
      Техническая долг может серьезно повлиять на здоровье организации - и на психическое здоровье ваших разработчиков. Более половины из 200+ членов инженерных команд, опрошенных в рамках отчета Stepsize "Состояние технического долга в 2021 году", считают, что технический долг негативно влияет на моральное состояние их команд.
    • Что люди не понимают в управлении потоком создания стоимости
      Нет ничего плохого в самом управлении потоками создания ценности (VSM), но есть много плохого в том, как его рассматривают и обсуждают блогеры, отраслевые маркетологи и другие, которые часто смешивают его с DevOps и Agile. Это не одно и то же.
    • 5 основных тенденций развития искусственного интеллекта и машинного обучения на 2022 год
      Вот несколько основных тенденций, к которым вашему бизнесу стоит начать готовиться. Искусственный интеллект и машинное обучение становятся доминирующей частью технологической
    • 6 тенденций в ИТ, за которыми нужно следить
      Чтобы выжить во время пандемии, организации обратились к ИТ, чтобы помочь справиться с последствиями - как негативными, так и позитивными. В некоторых отраслях, таких как телемедицина и видеоконференции, бизнес резко вырос, и ИТ-отделам таких компаний пришлось в спешке справляться с нагрузкой. В других, например, в сфере путешествий и развлечений, бизнес резко просел. Кроме того, возобновилось стремление к цифровой трансформации.
    • Восход Desktop-as-a-Service: что это такое и зачем вам это нужно?
      Широкое распространение облачных вычислений добавило в наш словарь множество сокращений, наиболее распространенными из которых являются SaaS, PaaS и IaaS. Действительно, наступила эра облачных решений, которые доставляют программное обеспечение, платформу и инфраструктуру потребителям и предприятиям по запросу и с оплатой по мере использования.
  •  
  • Вход

  • DevOps
    Kanban
    ITSM
    ITIL
    PRINCE2
    Agile
    Lean
    TOGAF
    COBIT