Развитие методов спутникового картографирования тридцатилетней динамики пахотных земель регионов России на основе временных серий данных Landsat
В рамках предыдущих исследований было показано, что объектно-ориентированные подходы и непараметрическая классификация позволяют обеспечить региональное картографирование используемых пахотных земель регионов России на основе синтезированных временных серий спутниковых данных Landsat для различных сезонов вегетации. Последующее масштабирование указанных подходов с использованием распределённых вычислений на базе ЦКП «ИКИ-Мониторинг» позволило расширить пространственный охват и увеличить глубину динамического картографирования. В частности, развитие в ИКИ РАН методов и технологий восстановления временных серий высокого временного разрешения для различных спутниковых систем с использованием весового подхода, пространственно-временного анализа и гармонической регрессии, позволило обеспечить построение сезонных спектрально-временных признаков распознавания пахотных земель в различные годы тридцатилетнего периода наблюдений.
Разработанная в рамках проведённых в 2022 г. работ технология картографирования используемых пахотных земель включает этап подготовки данных, этап параметризации классификатора и этап картографирования. На этапе подготовки данных происходит формирование многолетних рядов атмосферно-скорректированных наблюдений земной поверхности, полученных по данным программы Landsat за требуемый интервал времени. Далее, происходит исключение наблюдений, находящихся под влиянием мешающих факторов (облачность и тени от неё, снег, а также сбойные пиксели). На основе указанных выше технологий происходит восстановление пропущенных измерений и формирование месячных композитных изображений, а также производных признаков распознавания используемых пахотных земель для каждого из целевых сезонов мониторинга.
На следующем этапе для настройки и параметризации классификатора используется обучающая разметка для классов «используемая пашня» и «остальное», созданная экспертами путём фотоинтерпретации спутниковых снимков Sentinel-2 с использованием региональных геопространственных данных для эпохи 2019–2021 гг. Обученный классификатор затем переносился на другие эпохи с предварительной нормировкой распределения значений признаков к эпохе 2019 года.
На последнем этапе происходит автоматическое картографирование используемых пахотных земель для целевого интервала наблюдений с использованием нормализованных признаков и обученного классификатора с последующей экспертной оценкой результатов. Экспертная оценка полученной карты с привлечением архивных спутниковых снимков в картографическом интерфейсе системы «Вега» позволяет идентифицировать участки с ошибками распознавания обоих видов (пропуск цели и ложная тревога). Автоматический локализованный кластерный анализ позволяет сформировать и автоматически разметить кластеры, соответствующие ошибкам распознавания, позволяя минимизировать ошибки на соответствующих объектах земного покрова на следующих итерациях.
Общая блок-схема разработанной технологии приведена на рисунке 1.
Рисунок 1 — Общая блок-схема технологии распознавания используемых пахотных земель на основе спутниковых данных Landsat для различных периодов наблюдений в интервале с 1986 по 2016 г.
Для автоматического распознавания земель с признаками распашки или сева сельскохозяйственных культур в течение трёхлетнего временного отрезка был использован непараметрический метод Random Forest, обученный на разметке пахотных земель 2019–2021 гг. При создании разметки было использовано следующее определение: пашня — участок земной поверхности, имеющий в течение трёх лет наблюдений признаки распашки, выращивания озимых и яровых сельскохозяйственных культур с минимальным размером не менее 30 метров, не находящийся под теплицами и другими объектами или сооружениями, препятствующими дистанционному наблюдению. Для обеспечения совместимости между разновременными наборами признаков, полученными по данным различных приборов программы Landsat, и для переноса обученного классификатора на исторические интервалы в рамках субъекта федерации использовалась нормализация функции распределения значений признаков. Пример результатов приведения восстановленных композитных изображений, полученных за исторические эпохи, к распределению за 2019 г. можно увидеть на рисунке 2.
Рисунок 2 — Разновременной синтез месячных восстановленных композитных изображений Landsat за 1986 г. (слева снизу), разновременной синтез нормализованных к 2019 г. изображений Landsat за 1986 г. (слева сверху), разновременной синтез изображений Landsat за 2019 г. (справа сверху), а также разметка для классов «пашня» и «всё остальное» за 2019 г. (справа снизу) на примере Белгородской области
В целях обеспечения регулярности разновременных оценок, тридцатилетний интервал наблюдений был разбит на шесть пятилетних страт, для каждой из которых была получена карта используемой в течение трёх лет пашни для следующих субъектов федерации: Московская, Белгородская и Калининградская области, а также республик Татарстан и Удмуртия. Анализ временной серии шести полученных карт позволил идентифицировать последний год использования пашни на уровне отдельных полей
Рисунок 3 — Результаты динамического картографирования используемых пахотных земель Калининградской области с датой последнего года использования (вверху), динамика оценок различных категорий используемых земель (слева снизу), а также распределение площадей используемой пашни по дате последнего использования (справа внизу)
Сопоставление серии разновременных оценок площадей используемой пашни с данными Госкомстата СССР и Росстата, а также данных Всероссийской сельскохозяйственной переписи 2006 и 2016 гг. по каждому региону подтвердило совпадение трендов, полученных по данным дистанционного зондирования Земли и из статистических источников. Пример результатов анализа полученных разновременных карт используемой пашни на Калининградскую область, включая дату последнего использования полей и распределение площадей пашни по этой дате, а также сравнение оценок выявленных по данным дистанционного зондирования площадей с данными из различных статистических источников приведён на рисунке 3.