Детектирование и документация сбоев в работе распределённых информационных систем дистанционного мониторинга
Сычугов И.Г., Прошин А.А.
// Современные проблемы дистанционного зондирования Земли из космоса, 2014. Т. 11. №. 3. С. 233-245.
Для обеспечения надёжного функционирования распределённых информационных систем ДЗЗ, состоящих из большого числа станций обработки и серверов архивации спутниковых данных, требуется постоянный контроль над большим объемом поступающей информации о сбойных ситуациях для их своевременного исправления. Для этого необходимо иметь соответствующий инструмент в виде высокоэффективной системы детектирования и сопровождения сбоев, которая в свою очередь должна автоматически детектировать наибольшее число сбоев в системе для обеспечения актуальной информацией, своевременно информировать всех ответственных специалистов и при этом быть достаточно гибкой в настройке для поддержания развития ИС. Однако в случае появления необходимости одновременной поддержки нескольких ИС, функционально связанных между собой, использование независимых систем обнаружения сбоев становится неэффективным, ввиду резкого увеличения объема поступающей информации, а также необходимости работы с разными web-интерфейсами. В этом случае наиболее удобным и эффективным средством контроля за состоянием всех элементов всех поддерживаемых ИС будет единая система детектирования и сопровождения сбоев, которая будет обладать единым web-интерфейсом, доступом к информации об используемых программных и аппаратных компонентах, а также иметь собственные средства автоматической диагностики и информирования специалистов. В статье ставится задача создания подобной системы, а затем рассматриваются отдельные программные решения, используемые для её решения.
Ссылка на текст:
http://d33.infospace.ru/d33_conf/sb2014t3/233-245.pdf