Портал №1 по управлению цифровыми
и информационными технологиями

Вопрос из зала: Перспективы диагностики инцидентов «на лету»

Александр Мешков интересуется экспертными мнениями по поводу своей новой идеи.


В данный момент наша компания разрабатывает решение, позволяющее диагностировать инциденты «на лету», и нам хотелось бы услышать мнения уважаемых коллег о перспективах этой концепции – диагностики инцидентов «на лету».

Суть концепции заключается в том, что сервисный запрос на пути от пользователя к Службе поддержки обрастает сначала диагностической информацией (первый и второй этапы), а затем и проектом диагноза (третий этап). Таким образом, когда Служба поддержки получает Снимок Инцидента, ей остаётся только удостовериться в правильности диагноза и применить адекватное ему решение.

Более подробно алгоритм диагностики инцидентов «на лету» выглядит так.

Первый этап. На стороне пользователя создаётся некое формальное описание инцидента (Снимок инцидента). Предполагается автоматическое создание и регистрация инцидента с использованием специального ПО.

Второй этап. Снимок инцидента принимается системой мониторинга и связывается с метриками здоровья ИТ-инфраструктуры и качества ИТ-сервисов, отслеживаемыми системой мониторинга. Оценивается качество работы тех компонентов ИТ-инфраструктуры, которые, согласно описанию инцидента из Снимка инцидента, могут иметь к нему отношение, и Оценки качества прикрепляются к Снимку инцидента.

Третий этап. Снимок Инцидента передаётся в Диагностическую базу знаний. На основании Параметров окружения пользователя и Оценок качества, содержащихся в Снимке инцидента, выбирается вероятный диагноз (один или несколько) и тоже прикрепляется к Снимку инцидента. Снимок инцидента регистрируется в Service Desk. И вот результат: сотрудник поддержки получает сразу описание инцидента со стороны пользователя, со стороны ИТ-инфраструктуры (что было не так в момент инцидента и около) и вероятный диагноз. Мы полагаем, что такое решение оказалось бы небесполезным, по крайней мере, при диагностике типовых инцидентов, каковых большинство, и в особенности для крупных компаний, но хотелось бы услышать ваши мнения.


«VAP: Управление поддержкой ИТ-услуг»
Концентрация знаний и опыта без натаскивания на экзамен

Комментариев: 8

  • Vladimir Kapustin

    У нас чуть проще схема.

    При звонке по входящему номеру определяется клиент, и к моменту ответа оператора, ему выводится результат диагностики, но без диагнозов. Места, на которые стоит обратить внимание просто подсвечиваются, но конечное решение за оператором.

    • Денис Литовских

      А с помощью чего у вас собирается первоначальная диагностическая информация?

    • Aleksandr Meshkov

      Добрый день.

      Разрешите уточнить — под местами, на которые стоит обратить внимание, подразумеваются компоненты ИТ-инфраструктуры или — ?..

  • Aleksandr Meshkov

    Было бы слишком громко называть это только моей идеей — это концепция нашей компании)

  • Pavel Solopov

    Вопрос только в одном, кто будет разрабатывать достаточно не тривиальные алгоритмы диагностирования. Я встречал в некоторых системах мониторинга подобный функционал (попроще конечно), но нигде не встречал, чтобы он работал. Поскольку алгоритм из коробки не совсем подходит, а самим разрабатывать нет либо ресурсов, либо желания.

  • Sergey Yuditsky

    Коллега, мне кажется Вы немного усложняете :-).

    У нас разработан набор Экспертиз, позволяющих оценивать качество работы различных компонент ИТ-Инфраструктуры. Описание этих Экспертиз можно найти здесь: www.you-expert.ru. Их можно попробовать, загрузив бесплатный продукт QuTester Plus (www.prolan.ru/netconsulti...tester/form.html). Они используются много лет очень многими компаниями, список которых можно найти здесь: www.prolan.ru/netconsulti...tester/form.html

    Таким образом, задача сводится к решению двух задач:

    1. Описанию того, какие Оценки необходимо включать в Снимок Инцидента в зависимости от вида Сервиса и местоположения пользователя. Эта задача на два порядка проще, чем создание сервисно-ресурсной модели. Никакие алгоритмы для её решения не требуются. Достаточно здравого смысла. Если ИТ-Инфраструктура относительно небольшая и Сервисов не много, то задача решается за пару дней.

    2. Определению списка значимых параметров для каждой комбинации: «Что случилось» + Оценки Здоровья ИТ-Инфраструктуры. Здесь также никакие алгоритмы не требуются. Поясню на примере.

    У меня есть знакомый в Австралии, который работает в фирме по ремонту мониторов. Фирма 2,5 человека, а ремонтируют невообразимое число мониторов в месяц. Я спрашивал, как им это удается. Ответ: База Знаний. Никаких алгоритмов в ней нет, а есть набор признаков и соответствующий каждому набору «диагноз». Как только обнаруживается новая неисправность, они её сразу заносят в Базу Знаний. Это, как он говорит Absolutely Must, даже не обсуждается. За счет этого, как он говорит, в 90% случаев, он неисправность не ищет, а просто проверяет описанные в Базе Знаний признаки. Собственно, ровно та же самая идея предлагается и в «Диагностике на лету». Просто другие признаки и другие диагнозы. Всё что нужно, это корректно записывать признаки после диагностики каждого инцидента.

  • Sergey Yuditsky

    Павел, понимаю, откуда появился вопрос. Александр, при описании идеи, не дал ссылку на описание того, как она должна решаться :-).

    Решение кратко описано здесь: blog.prolan.ru/2013/03/%D...%B5%D1%82%D1%83/


Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

  • Рубрики

  •  
  • Авторы

  •  
  • Самое свежее

    • Новая модель предоставления ИТ-услуг: почему вам нужно ориентироваться на продукт
      Традиционно ИТ-организации делят все предоставляемые ими услуги на три уровня: инфраструктура (инфраструктура как услуга), платформа (платформа как услуга) и приложения
    • Как DevOps-командам следует использовать метрики DORA
      С момента выхода в 2018 году книги «Accelerate: Наука о бережливом программном обеспечении и DevOps», показатели DORA, которые она представила, стали популярным
    • Лучше делать хоть что-то, чем не делать ничего
      На конференциях по всяким Agile и DevOps мы часто слышим слово «unlearn» — забудьте то, что вы знали ранее! Измените свои представления о мире! Всё устроено
    • VI форум «Управление данными — 2021»: наведите порядок в данных!
      23 сентября 2021 года издательство «Открытые системы» в шестой раз проведет в Москве масштабный форум «Управление данными — 2021», объединяющий всех, кто определяет стратегию работы с данными, воплощает ее в жизнь и управляет предприятием на основе объективных достоверных данных. Участники форума обсудят не только инновационные стратегии и бизнес-модели работы с корпоративными данными, но и конкретные архитектурные и технологические решения.
    • Простые уловки, как ускорить процесс разработки программного обеспечения
      С некоторыми вещами люди из бизнеса вынуждены соглашаться, и одна из них заключается в том, что никто не хочет сердить свою команду разработчиков. Часто они являются краеугольным
    • Почему каждая инициатива DevOps должна начинаться с оценки возможностей
      Внедрение практики DevOps идет полным ходом. Организации сосредоточены на том, как внедрить возможности DevOps в командах и как масштабировать DevOps в масштабах предприятия. Но важным аспектом любого пути масштабной трансформации является оценка возможностей команды или организации на этом пути.
    • Что такое процесс и что такое практика в ITIL®4
      Продолжаем публиковать короткие видеоролики, посвященные актуальным вопросам управления ИТ. Сегодня поговорим о том, что такое процесс и что такое практика в ITIL4. Это не переименование процессов в практики, это два отдельных понятия. Рассказывает Игорь Фадеев, ITIL 4 Managing Professional и ITIL 4 Strategic Leader, аккредитованный тренер по ITIL4.
    • Аудит. Что может быть скучнее?!
      На прошедшей неделе участвовал в аудите (в качестве объекта аудита). Большинство людей, проходивших аудит, подозреваю, разделяет это ощущение: «Бюрократия, формальности и т.п.»
    • Как технический долг вредит вашей команде программистов — и вашей безопасности приложений
      Техническая долг может серьезно повлиять на здоровье организации - и на психическое здоровье ваших разработчиков. Более половины из 200+ членов инженерных команд, опрошенных в рамках отчета Stepsize "Состояние технического долга в 2021 году", считают, что технический долг негативно влияет на моральное состояние их команд.
    • Что люди не понимают в управлении потоком создания стоимости
      Нет ничего плохого в самом управлении потоками создания ценности (VSM), но есть много плохого в том, как его рассматривают и обсуждают блогеры, отраслевые маркетологи и другие, которые часто смешивают его с DevOps и Agile. Это не одно и то же.
  •  
  • Вход

  • DevOps
    Kanban
    ITSM
    ITIL
    PRINCE2
    Agile
    Lean
    TOGAF
    COBIT