Документирование сбоев в работе комплекса. Система ведения сбоев
Для документирования всех неполадок в работе системе, оперативного оповещения о них ответственных специалистов и отслеживания процесса их устранения была реализована специализированная система ведения сбоев. При этом реализуется два основных источника поступления в нее сведений об ошибках: получение информации от программных компонент автоматического контроля различных типов сбоев и «ручное» занесение этой информации пользователями информационных систем и специалистами, осуществляющими их разработку и поддержку. Ниже перечислены основные функциональные блоки разработанной системы
- Интерфейс для поиска и просмотра информации об обнаруженных неполадках в работе различных информационных систем, реализованных на базе возможностей ЦКП «ИКИ-Мониторинг». Отдельный режим работы этого интерфейса реализован для дежурного на текущий день специалиста, основной задачей которого является контроль устранения всех актуальных сбоев в работе комплекса.
- Блок редактируемой справочной информации о типах работ и соответствующих им ответственных специалистах
- Интерфейс занесения информации об ошибках с возможностями классификации сбоев по проектам, организациям и направлениями работ, указания ответственного, степени критичности сбоя, ведения истории изменений и комментариев и др.
- API для заведения сбоев системами автоматического детектирования ошибок
- Подсистема оперативного оповещения ответственных специалистов по электронной почте
- Подсистема формирования ежедневных отчетов о неисправленных на текущий момент критических неполадках в работе комплекса с указанием ответственных, длительности сбоя и другой информации
Типичному жизненному циклу каждого сбоя соответствует следующий набор основных его статусов: новый, направлен, принят, исправлен. При необходимости сбою присваивается статус «критический». Такими, в частности, является большинство автоматически детектируемых сбоев. Примеры интерфейсов системы ведения сбоев приведены на рисунках 1, 2.
Рисунок 1 - Просмотр информации о сбоях в работе комплекса
Рисунок 2 - Редактирование информации о сбое