AIOps включает в себя использование технологий AI и ML наряду с большими данными, интеграцией данных и технологиями автоматизации, чтобы сделать ИТ-эксплуатацию более умной и прогнозируемой.
Что такое AIOps
Искусственный интеллект для ИТ-эксплуатации (AIOps) включает в себя использование технологий искусственного интеллекта и машинного обучения наряду с большими данными, интеграцией данных и технологиями автоматизации, чтобы помочь сделать ИТ-эксплуатацию умной и прогностической. AIOps дополняет ручные операции машинными решениями.
Типы решений AIOps
На высоком уровне решения AIOps делятся на две области: доменно-ориентированные и доменно-агностические, как это определено Gartner. Решения, ориентированные на домены, применяют AIOps для определенного домена, такие как мониторинг сети, мониторинг журналов, мониторинг приложений или сбор журналов. Вы часто будете видеть, как поставщики средств мониторинга заявляют о AIOps, но в основном они не зависят от предметной области, привнося мощь ИИ в домен, которым они управляют. Решения, не зависящие от предметной области, работают более широко и работают в разных доменах, мониторинге, ведении журналов, облаке, инфраструктуре и т. и., и они берут данные из всех доменов / инструментов и учатся на этих данных для более точного установления шаблонов и выводов.
Качество и полнота данных
Успех AIOps зависит от качества и полноты данных, которые вы предоставляете для решения, и чем более полными являются данные, тем лучше они могут извлечь уроки из шаблонов и предоставить выводы. Если у вас есть пробелы в видимости производительности ИТ, сначала рекомендуется заполнить эти пробелы с помощью современного решения мониторинга или наблюдения, как CloudFabrix Observability.
Обогащение данных
Решения AIOps также необходимы для понимания того, как услуги приложений и активы связаны друг с другом, чтобы при возникновении оповещений или событий инструмент мог принимать во внимание эти взаимосвязи, чтобы более точно управлять корреляциями или выводами первопричины. Большинство реализаций зависят от ручных или внешних данных для передачи этих данных в AIOps, что становится все более обременительным и со временем становится дорогостоящим для внедрения и обслуживания.
Некоторые современные инструменты AIOps (например, CloudFabrix) достаточно хороши для фактического обнаружения и установления своей контекстной топологии приложения/услуги сами по себе и при желании могут интегрироваться с системами CMDB или IT Asset Management (ITAM), чтобы использовать эти инструменты либо для начального контекста, либо для автоматизированной периодической подачи данных.
Топ 10 самых распространённых вариантов использования AIOps
Вот некоторые распространенные варианты использования или проблемные области, которые можно решить с помощью AIOps:
- Выявление проблем на основе аномалий или отклонений от нормального поведения.
- Прогнозирование значения определенной метрики для предотвращения сбоев или повышения оперативной готовности.
- Группировка или кластеризация оповещений, событий или журналов на основе симптомов или текстовых описаний.
- Группировка связанных предупреждений на основе топологии или атрибутов предупреждений.
- Получение работоспособности приложения или сервера на основе нескольких датчиков или телеметрических данных.
- Выявление коррелированных метрик временных-рядов или симптомов для более быстрого вывода о первопричине.
- Поиск подобных инцидентов для ускорения их разрешения.
- Распознавание названных сущностей для обогащения инцидентов для более быстрой их обработки.
- Прогнозирование группы назначения инцидента на основе атрибутов инцидента.
- Классификация инцидентов с использованием обработки естественного языка может также использовать внешние услуги, такие как OpenAI/GPT-3.
AIOps: Цели и ключевые преимущества
Конечная цель AIOps заключается в том, чтобы обеспечить ИТ-трансформацию, более умную и предсказуемую эксплуатацию. С помощью инструментов AIOps ИТ-организация получает унифицированный анализ событий, снижает уровень шума в ИТ-данных и снижает трудозатраты, сокращает объем ИТ-заявок, быстрее решает ИТ-проблемы, предсказывает/предотвращает сбои до воздействия на клиента, автоматизирует анализ первопричин, ускоряет разрешение инцидентов или проблем, улучшает ИТ производительность и снижение совокупной стоимости владения.
С оригиналом статьи можно познакомиться по ссылке.