Система функциональной локализации сбоев ИТ-услуг
Созданная во Внешэкономбанке система управления ИТ-деятельностью является одним из мощных инструментов решения стратегических задач корпорации.
Внешэкономбанк реализует на плановой основе организационные и технические мероприятия и проекты по поддержке и развитию системы управления ИТ-деятельностью, в том числе обучение специалистов ИТ-службы современным методикам управления ИТ-услугами. В 2012 году на конкурсе «ITSM-проект года» Внешэкономбанк был признан лидером в номинации «Комплексная система управления ИТ», что говорит о высоком уровне зрелости созданной в Банке системы управления ИТ-деятельностью и всей ИТ-службы в целом.
Постановка задачи
В настоящее время во Внешэкономбанке сформирован каталог ИТ-услуг на основе более чем 200 ИТ-систем, предназначенных для поддержки корпоративных бизнес-процессов.
Предоставление этих услуг обеспечивает сложная и интенсивно развивающаяся ИТ-система Банка, включающая прикладное программное обеспечение и технологическую платформу, контроль работоспособности которых – необходимое условие обеспечения доступности ИТ-услуг для конечных пользователей.
Банк обладает инструментами мониторинга, которые предоставляют администраторам и дежурной смене детальные данные о состоянии ИТ-инфраструктуры. Существующий инструментарий обеспечивает:
- мониторинг сетевого активного оборудования с использованием ПО HP Network Node Manager и CiscoWorks;
- мониторинг приложений и работоспособности ИТ-ресурсов с использованием ПО HP Operations Manager, средств операционных систем, средств VMware и средств СУБД Oracle, охватывающих ограниченное количество ИТ-ресурсов для дежурной смены отдела автоматизации информационных систем (ОАИС).
Однако имеющиеся системы мониторинга предоставляют информацию об элементах, но не обеспечивают всю полноту информации о доступности ИТ-услуг и не решают задачу локализации возникающих сбоев, способных повлиять на доступность ИТ-услуг. Поэтому в Банке назрела необходимость создания комплексной системы функциональной локализации сбоев , нацеленной на автоматизированную локализацию и предотвращение сбоев ИТ-услуг.
Было принято решение о создании Системы функциональной локализации сбоев ИТ-услуг Внешэкономбанка (СФЛС). СФЛС предназначена для контроля доступности ИТ-услуг Банка, раннего обнаружения, локализации причины сбоя, анализа степени влияния на доступность ИТ-услуг и оповещения о сбоях в работе ИТ-услуг и их компонентов.
Решение HP BUSINESS SERVICE MANAGEMENT
Для реализации СФЛС специалистами ИНЛАЙН ГРУП было предложено решение на базе программного обеспечения HP BSM (Business Service Management), которое было выбрано как наиболее полно отвечающее требованиям к системе и позволяющее создать единое информационное пространство управления всей ИТ-инфраструктурой Внешэкономбанка.
«Важнейшей особенностью СФЛС, основанной на HP BSM, является ее способность органичного объединения множества «взглядов» на объект управления (ИТ-услугу), предоставляющая всестороннее представление о «здоровье» ИТ-услуги. В частности, объединение взгляда «изнутри» (мониторинг параметров сети передачи данных, серверов, операционных систем и приложений) и взгляда «снаружи» (эмуляция действий пользователей, контроль времени отклика) в СФЛС позволяют уже при обнаружении сбоя определить его влияние на доступность ИТ-услуги», - считает Сергей Новиков, руководитель отдела систем управления ИТ-инфраструктурой компании ИНЛАЙН ГРУП.
Ключевыми компонентами HP BSM в СФЛС являются:
Operations Manager i – ядро СФЛС. Осуществляет сбор, обработку данных от собственных агентов и внешних систем, обеспечивает привязку всех объектов к единой топологии в специализированной CMDB (RTSM), обеспечивает передачу сообщений и синхронизацию статусов между всеми компонентами.
Business Process Monitor – система мониторинга, выполняющая эмуляцию действий реального пользователя и предоставляющая информацию о доступности и производительности ИТ-услуг с точки зрения конечного пользователя.
RTSM – (Real Time Service Model) оперативная конфигурационная база данных, хранящая объекты и модели ИТ-услуг для целей мониторинга.
Topology Correlation – система корреляции событий для определения степени влияния ИТ-услуг и поиска корневой причины сбоя.
В результате реализации проекта Внешэкономбанк получил результаты по основным целям:
Поддержка и развитие существующих процессов управления ИТ. Создание Системы направлено на поддержку существующих процессов ИТ-управления Внешэкономбанка в части управления доступностью и качеством ИТ-услуг, а также в части поддержки ИТ-услуг, включая управление инцидентами, проблемами и управление операциями ИТ-услуг.
Управляемость. Предоставление дополнительной информации о доступности ИТ-услуг позволяет сотрудникам службы поддержки пользователей принимать своевременные, взвешенные и обоснованные решения.
Повышение качества. Уменьшение рисков снижения качества ИТ-услуг, контролируемых СФЛС.