Несколько раз слышал от разных людей "Не работает у нас управление проблемами, т.к. проблем нет, соответственно и решать нечего".
Можно было бы за такие успехи порадоваться, если бы не одно сомнение, которое заключается в том, что практика показывает, что проблемы есть всегда. Просто не каждую проблему готовы таковой считать и тратить на нее время. Многим из курса ITIL запомнилась взаимосвязь проблем с повторяющимися инцидентами вызванными ошибкой в инфраструктуре. И, соответственно, раз не видим повторяющиеся инциденты, значит и проблем нет.
Однако есть еще одно соображение, про которое иногда почему-то забывают. Решение проблемы, по сути, это устранение ошибки в инфраструктуре, при этом ошибка не обязательно может привести к многочисленным инцидентам, в некоторых случаях достаточно одного инцидента, который привел к масштабному простою. Иногда даже можно не дожидаться инцидентов и заранее понимая, что в инфраструктуре есть ошибка, постараться устранить ее не полагаясь на "авось".
В итоге приходим к тому, что источниками информации о наличии проблем могут быть (в порядке возрастания ресурсов на выявление):
- Инциденты с высоким влиянием на ИТ-услуги, повторения которых хочется избежать
- Анализ базы инцидентов для выявления повторяющихся
- Результаты анализа самой инфраструктуры
Каждый из этих пунктов требует ресурсов. Что выбрать для себя зависит от конкретной организации, ее ресурсов, целей и т.д.
“инцидент, который привел к масштабному простою” устраняют и тут же расследуют в “аварийном” режиме, поэтому явных причин называть это проблемой желания не возникает. Потом уже, по факту можно, если менеджер проблем подсуетится.
А вот про 3 пункт – вообще ощущение двоякое. Часто с таких проблем начинают, когда не знают с какого бока подойди. И вот висят они, несчастные, никому не нужные и итак всем известные, с много раз просроченными сроками. Потому что либо влияния на сервис от них, либо ресурсов на диагностику и устранение.