Разработка автоматизированной системы совместного анализа спутниковых и статистических данных для оценки урожайности сельскохозяйственных культур
Прогнозирование урожайности посевов сельскохозяйственных культур представляет интерес для широкого круга потребителей: от министерств сельского хозяйства (страны или отдельных регионов) до отдельных сельхозтоваропроизводителей. Важное значение для решения этой задачи имеют методы, позволяющие получать заблаговременные оценки ожидаемой продуктивности посевов на больших территориях, основанные на использовании данных спутниковых наблюдений.
На протяжении последних нескольких лет в ИКИ РАН проводились эксперименты по оценке урожайности сельскохозяйственных культур с использованием возможностей сервиса спутникового мониторинга Вега-Science на уровне субъектов Российской Федерации. Возможность получения таких оценок основана на наличии тесной связи между максимальными значениями вегетационного индекса NDVI (Normalized Difference Vegetation Index, нормализованный разностный вегетационный индекс) озимых и яровых культур, полученными на основе данных спутниковых наблюдений (при проведении экспериментов использованы данные спутниковых приборов MODIS), с урожайностью озимых зерновых и яровых зерновых и зернобобовых соответственно (в качестве источника данных об урожайности используется ЕМИСС — Единая межведомственная информационно-статистическая система Росстата, https://www.fedstat.ru/). Примеры графиков, иллюстрирующих такую связь, приведены на рисунке 1.
а
б
Рисунок 1.2.4.1 — Графики, иллюстрирующие связь максимальных значений NDVI:
а — озимых культур с урожайностью озимой пшеницы в Ставропольском крае;
б — яровых культур с урожайностью яровых зерновых и зернобобовых
в Республике Татарстан за период с 2001 по 2022 г.
В продолжение этих экспериментов написана программа, автоматизирующая процесс сбора и совместной обработки статистической и спутниковой информации для оценки ожидаемой продуктивности посевов сельскохозяйственных культур.
Программа представляет собой консольное приложение. Взаимодействие с ней происходит путем последовательного ввода команд на запрос, обработку и вывод информации. Программа автоматически запрашивает следующую информацию:
- из «Вега-Science» — еженедельные значения NDVI, усредненные по участкам, занятым озимыми или яровыми культурам в анализируемом регионе;
- из ЕМИСС — ежегодные значения урожайности заданной сельскохозяйственной культуры или группы культур в заданном регионе.
Соответствующие значения извлекаются с 2001 г. Кроме того, программа может использовать дополнительную информацию, предварительно подготовленную пользователем:
- об урожайности — из бюллетеней о состоянии сельского хозяйства, публикуемых Росстатом в формате excel (https://rosstat.gov.ru/folder/11110/document/13277). Использование этого источника оказалось актуальным для получения сведений об урожайности за 2022 г., поскольку в ЕМИСС они не были опубликованы;
- об урожайности и NDVI, полученную с эталонных полей.
Программа анализирует временные ряды NDVI и извлекает максимальные значения за каждый год, после чего рассчитывает коэффициент корреляции между этими значениями и показателями урожайности соответствующих лет. По каждому региону также строятся регрессии двух типов: линейная и экспоненциальная (в ряде случаев было отмечено, что данные лучше аппроксимируются с помощью экспоненциальной зависимости).
На основе регрессий и максимального значения NDVI анализируемого года рассчитывается прогнозное значение урожайности. На основе ретроспективных данных об урожайности и максимумах NDVI рассчитывается также точность прогноза, которая характеризуется средней абсолютной ошибкой.
Вся полученная программой информация автоматически экспортируется в виде графиков в формате.jpg и.pdf, а также размещается в отчеты двух форматов: doc и xls. Фрагмент сформированного отчета в формате Microsoft Word приведен на рисунке 2.
Рисунок 2 — Фрагмент отчёта, формируемого в автоматическом режиме программой, предназначенной для оценки урожайности сельскохозяйственных культур на основе спутниковых и статистических данных