Loading
Пропустить Навигационные Ссылки.

Авторизоваться
Для зарегистрированных пользователей

Результаты исследования эффективности разносезонной информации для спутникового картографирования озимых культур в весенне-летний период вегетации

В рамках работ за отчетный период было проведено исследование возможности повышения точности распознавания озимых культур путём обучения и применения универсальной разносезонной модели на основе непараметрического классификатора с использованием в качестве признаков ежедневных безоблачных изображений вегетационного индекса NDVI, полученных за ряд архивных лет. Ранее было показано, что разносезонные данные, описывающие фенологию сельскохозяйственных культур, способствуют улучшению результатов распознавания широкого набора культур целевого сезона вегетации. Для решения задач автоматического оперативного спутникового агромониторинга территории России необходимо использовать ежедневную информацию, характеризующую актуальное состояние и динамику биомассы сельскохозяйственных культур, которая, в частности содержится в ежедневных композитных изображениях, восстановленных на основе весового подхода и метода интерполяции LOWESS. Также ранее было показано, что разработанный в ИКИ РАН автоматический метод для оперативного распознавания озимых культур России на национальном уровне пространственного характеризуется региональной точностью от 70 до 98 %, однако указанный метод ограничивается использованием спутниковых данных, соответствующих только одному целевому сезону вегетации озимых.

В рамках исследования были задействованы архитектуры Random Forest и XGBoost, которые являются классическими непараметрическим классификаторами, стойкими к переобучению и демонстрирующие высокую точность на похожих задачах дистанционного зондирования Земли. Необходимо отметить, что входные разносезонные данные имели объем порядка нескольких сотен гигабайт, существенно превышая лимиты оперативной памяти на стандартном обработчике, поэтому в программной реализации были задействованы методы обработки и анализа больших данных, а также подходы по оптимизации алгоритмов с использованием технологии CUDA.

 
Рисунок 1 — Диаграмма рассеяния для площадей озимых по данным односезонного алгоритма (разметка — зелёные маркеры), двум разносезонным моделям (random forest — красные маркеры, xgboost — синие маркеры) и данным Росстат для 43 субъектов РФ за пять последовательных сезонов вегетации (с 2015 по 2019 годы)

В результате работы были обучены разносезонные модели на основе архитектур Random Forest и XGBoost, с помощью которых были получены сезонные карты размещения озимых культур для 43 субъектов преимущественно Европейской части РФ для каждого из сезонов вегетации в интервале с 2015 по 2019 г. Рассчитанные на основе этих карт региональные площади озимых сравнивались с соответствующими площадями, извлеченными из стандартных односезонных карт озимых (разметкой) и данных Росстат с расчетом метрик стандартного отклонения (RMSE) и коэффициента детерминации (R2). На агрегированной за пять лет диаграмме рассеяния (рисунок 1) красные метки соответствуют модели Random Forest, синие — XGBoost, а зелёные — картам на основе односезонного алгоритма.
Оценки значений стандартного отклонения (рисунок 2, вверху) и коэффициента детерминации (рисунок 2, внизу) были получены для каждого из пяти сезонов для территории 43 субъектов РФ из региона исследования. Результаты разносезонной модели Random Forest обозначены на этих рисунках красным цветом, по XGBoost — синим, по данным односезонного алгоритма — зелёным. Графики демонстрируют систематическое улучшение оценок площадей, полученных с помощью обоих разносезонных моделей в сравнении с оценками по данным односезонного подхода (разметкой). В частности, было обнаружено, что среднеквадратическая ошибка отклонения от данных Росстат по данным модели Random Forest оказалась ниже в среднем на 26,6 тыс. га, а коэффициент детерминации вырос в среднем на 3,7 %. Будучи в среднем хуже, чем Random Forest, XGBoost в среднем также демонстрирует улучшение результатов в сравнении с односезонным алгоритмом, однако результаты этой модели выглядят менее устойчивыми между сезонами.

 

 
Рисунок 2 — Стандартное отклонение площадей детектируемых озимых от площадей Росстат (вверху) и коэффициент детерминации R2 (внизу) при сопоставлении площадей с данными Росстат по результатам работы односезонного алгоритма (разметка) и двух разносезонных моделей (random forest и xgboost) для территории 43 субъектов Европейской части РФ

Таким образом, в рамках выполненных работ были параметризованы и на основе больших объемов спутниковых данных обучены разносезонные модели непараметрических классификаторов для распознавания озимых культур текущего сезона вегетации на больших территориях. В процессе построения моделей была проведена их существенная оптимизация, что привело к значительному сокращению временных затрат на обучение. Было показано, что с использованием разносезонных спутниковых данных можно создать универсальную модель, которая в среднем лучше справляется с задачей субнационального распознавания озимых культур, чем метод, основанный на данных только текущего сезона вегетации. Разносезонная модель Random Forest показала себя лучше всех исследуемых подходов, что может объясняться высокими характеристиками этого метода, в частности, высокой обобщающей способностью и стойкостью к переобучению, которые превосходят аналогичные характеристики многих других методов машинного обучения.