Организации, которые тратят время и усилия на решение проблем, получают огромную отдачу от своих инвестиций. Хотя исправление инцидентами, когда они происходят, очень важно, гораздо лучше, чтобы они вообще не происходили; и если вы не можете их предотвратить, то по крайней мере убедитесь, что вы знаете, как минимизировать влияние будущих инцидентов.
ITIL (ведущие в мире лучшие практики управления ИТ-услугами) говорит, что целью управления проблемами является «снижение вероятности и воздействия инцидентов путем выявления фактических и потенциальных причин инцидентов, а также управления обходными решениями и известными ошибками».
Каковы фазы управления проблемами?
Согласно ITIL 4 (последний выпуск ITIL, опубликованный в феврале 2019 года), управление проблемами имеет три этапа
- Идентификация проблемы – которая идентифицирует и регистрирует проблемы
- Контроль проблем – который анализирует проблемы и разрабатывает обходные решения
- Контроль ошибок – который отслеживает и улучшает обходные решения и решает проблемы, если это выглядит экономически эффективным
Как большинство организаций выявляют проблемы?
Большинство организаций используют два метода для выявления проблем
- Произошел значительный инцидент, и организация должна понять основные причины, чтобы подобное больше не повторилось. Процесс управления значительными инцидентами фокусируется на устранении инцидентов и восстановлении нормальной работы, а затем включается управление проблемами для анализа того, что произошло и что необходимо сделать дальше.
- Было много подобных инцидентов. Каждый из них был расследован и закрыт, но они могут повториться и оказать существенное совокупное влияние на заказчиков или организацию поставщика услуг. Этот кластер подобных инцидентов обычно идентифицируется анализом тенденций в записях инцидентов или персоналом службы поддержки, признающим, что нечто подобное уже случалось ранее. Действия по управлению проблемами необходимы для выявления основной причины инцидентов и принятия решения о том, как предотвратить их в будущем или, по крайней мере, уменьшить их влияние.
Проблема этих подходов в том, что идентификация приходит слишком поздно. Деятельность по управлению проблемами после инцидентов имеет важное значение, поскольку она может помочь уменьшить воздействие будущих инцидентов. Но для всех будет гораздо лучше, если проблема будет выявлена до того, как она вызовет какие-либо инциденты, а не после того, как она оказала значительное влияние на организацию.
Когда лучшее время для выявления проблемы?
Каждый инцидент приводит к потере производительности для одного или нескольких пользователей и требует усилий со стороны организации, предоставляющей услуги. Если вы сможете выявить проблемы до того, как они вызовут инциденты, тогда вы сможете обеспечить гораздо лучшие услуги для своих пользователей и даже сократить свои расходы! Это хорошо для всех, но требует некоторого планирования и усилий.
Как определить проблемы, которые еще не вызвали инциденты
Итак, как вы можете определить проблемы, не дожидаясь их возникновения в первую очередь? Какие действия, процессы или практики могут привести к тому, что проблемы будут регистрироваться, анализироваться и решаться до того, как они приведут к снижению производительности и увеличению затрат?
Вот несколько практических шагов, которые вы можете предпринять.
Просмотр веб-сайтов поставщиков и объявлений
Каждая организация использует некоторые сторонние продукты как часть своего ИТ-решения. Они могут включать в себя:
- Пользовательские устройства, такие как настольные и портативные компьютеры, ноутбуки и телефоны
- Программное обеспечение операционной системы, работающее на пользовательских устройствах и на серверах
- Приложения, работающие на пользовательских устройствах
- Коммерческое программное обеспечение, работающее как облачные сервисы или на ваших локальных серверах
- Сетевая инфраструктура, такая как коммутаторы, маршрутизаторы, брандмауэры и т. д.
- И многое другое …
Все эти продукты могут содержать дефекты, и вы, зачастую, можете узнать об этих дефектах прежде, чем они окажут какое-либо влияние на ваших пользователей, если вы попытаетесь отслеживать объявления, которые делает поставщик, на своем веб-сайте, или через новостные рассылки или другие сообщения. В зависимости от ваших отношений с поставщиком вы можете регулярно общаться с менеджером по работе с клиентами, и он сможет уведомить вас о значительных проблемах.
Каждый раз, когда вы узнаете о дефекте в стороннем продукте, который вы используете, это становится возможностью устранить проблему до того, как она возникнет в вашей среде. Вещи, которые вы можете сделать, включают в себя:
- Разработайте план того, как вы будете реагировать при возникновении неизбежных инцидентов, чтобы вы могли уменьшить воздействие на своих пользователей и свою ИТ-организацию
- Поймите точные обстоятельства, которые могли вызвать инциденты, и измените настройку или порядок использования продукта, чтобы избежать их запуска
- Следите за будущими объявлениями, чтобы убедиться, что вы сможете применять любые исправления или другие решения, как только они станут доступны
- В экстремальных ситуациях вы можете рассмотреть вопрос о замене неисправного продукта на тот, который не имеет дефекта. Имейте в виду, что это имеет смысл только в том случае, если проблема серьезна.
Работать в тесном контакте с внутренними командами разработчиков
Во многих организациях есть группы разработчиков программного обеспечения, которые разрабатывают и поддерживают приложения, которые они используют. Вы должны убедиться, что у вас хорошие рабочие отношения между оперативным персоналом и специалистом по разработке. Это важно, чтобы узнавать о проблемах и ошибках по мере их возникновения, работать вместе над их устранением, планировать, как управлять любыми инцидентами, которые они могут вызвать. Вы также должны работать вместе, чтобы расставить приоритеты для решения любых проблем и ошибок, чтобы обеспечить своевременное устранение наиболее значимых проблем.
Мониторинг сообществ пользователей и социальных сетей
Если у вас очень большое количество пользователей, особенно если некоторые или все пользователи находятся за пределами вашей компании, важно отслеживать сообщества пользователей и социальные сети, чтобы узнать о проблемах, с которыми пользователи сталкиваются, если они не вошли в систему как инциденты. Иногда вы обнаруживаете, что пользователи разработали совершенно хорошие обходные решения для себя, и вы можете принять их, чтобы помочь решить основную проблему, конечно, с признанием заслуги людей, которые внесли свой вклад в решение, где это применимо.
Вы также можете присоединиться к сообществам пользователей, которые поддерживают сторонние продукты, которые вы используете, и это может позволить вам выявлять проблемы, которые затрагивают другие организации, прежде чем они станут видимыми в вашей собственной среде.
Используйте сторонние услуги по оценке угроз и тестированию на проникновение
Эти типы услуг могут помочь вам предотвратить инциденты безопасности, определив, как вас могут атаковать, и где вы можете быть уязвимы.
Услуги по оценке угроз предоставляются организациями, которые следят за широким спектром организаций, которые ищут, какие существуют угрозы, и в какой степени они используются. Они могут предоставить вам информацию, которая может помочь избежать инцидентов, связанных с безопасностью, путем принятия активных защитных мер, прежде чем ваша собственная организация подвергнется атаке. Точно так же тестирования на проникновение могут выявить уязвимость в вашей защите, которую вы можете устранить до того, как произойдут какие-либо инциденты.
Заключение
Если вы используете управление проблемами только для анализа инцидентов, которые уже произошли, вы всегда будете реагировать после того, как пострадали ваши пользователи. Подумайте о том, что может произойти в будущем, и вы сможете избежать проблем и повысить свою ценность для своих пользователей и клиентов, часто с уменьшением ваших общих затрат.
Оригинал статьи доступен по ссылке.