Портал №1 по управлению цифровыми
и информационными технологиями

Бесплатная экспертная база знаний по управлению ИТ

 
Надёжность
 
Способность продукта, услуги или другой конфигурационной единицы выполнять свою предназначенную функцию в течение заданного периода времени или заданного числа циклов.
Answer
Оригинальный английский термин
reliability
Answer
Подробности
Надёжность в ITSM описывает, насколько стабильно продукт, услуга или конфигурационная единица выполняют то, для чего они предназначены, без сбоев в заданном временном интервале или на протяжении определённого количества повторяющихся операций. На практике это одна из ключевых характеристик качества услуги и важный вклад в ценность: даже если услуга полезна, низкая надёжность приводит к частым инцидентам, потере доверия заказчика и росту затрат на поддержку. Надёжность часто рассматривают при проектировании услуг и управлении уровнем услуг, а также при принятии решений об архитектуре, резервировании и выборе поставщиков. Её оценивают и улучшают через мониторинг, анализ тенденций инцидентов, управление проблемами, устранение известных ошибок и снижение технического долга. Надёжность применима как к ИТ-услуге целиком, так и к её компонентам: приложению, базе данных, сетевому оборудованию, интеграциям, а также к операционным процедурам, если они повторяются и имеют измеримый результат. Вне охвата термина находятся вопросы быстроты восстановления после сбоя (это скорее про ремонтопригодность и целевое время восстановления), а также вопросы полезности услуги как соответствия потребностям заказчика.
Answer
Нюансы
Надёжность часто путают с доступностью: доступность описывает долю времени, когда услуга доступна для использования, а надёжность — частоту и предсказуемость выполнения функции без сбоев. Услуга может иметь высокую доступность и при этом низкую надёжность, если она формально «работает», но регулярно даёт ошибки в ключевых транзакциях или периодически деградирует, вызывая инциденты. Ещё одна типичная путаница — с ремонтопригодностью: ремонтопригодность показывает, насколько быстро и удобно восстанавливать услугу, но не то, как часто происходят сбои. На практике ошибочно считать надёжность исключительно характеристикой инфраструктуры; программные дефекты, нестабильные изменения, ошибки конфигурации и недостаточная валидация и тестирование напрямую снижают надёжность услуги. Также распространена ошибка измерять надёжность только одним показателем вроде MTBF, не уточняя, что считается «сбоем» и какую «предназначенную функцию» измеряют; без чётких критериев разные команды трактуют метрику по-разному. Наконец, улучшение надёжности нельзя сводить к «больше мониторинга»: мониторинг помогает обнаруживать события и инциденты, но устойчивый рост надёжности обычно достигается системным устранением причин через управление проблемами и дисциплину управления изменениями.
Answer
Примеры
  • Платёжный сервис обрабатывает транзакции без ошибок в течение согласованных 30 дней при ожидаемой нагрузке; сбой любой транзакции считается нарушением надёжности
  • Веб-приложение выполняет функцию поиска: не более 1 ошибки на 100 000 поисковых запросов (циклов) в рабочей среде
  • Очередь сообщений гарантированно доставляет сообщения без потерь в течение суток непрерывной работы; потеря сообщения классифицируется как сбой конфигурационной единицы
  • Резервное копирование выполняется успешно 99,5% ночных запусков за квартал; неуспешный запуск считается отказом выполнения предназначенной функции
  • Сетевой канал между площадками поддерживает стабильную передачу данных без разрывов сессий в течение рабочей смены; разрыв сессии фиксируется как сбой
Courses
Рекомендуемые продукты по этой теме
 
 
Что такое надёжность в ITIL и ITSM? Смотрите в глоссарии по управлению ИТ, входящим в бесплатную экспертную базу знаний по управлению ИТ от компании Cleverics.