Развитие методов спутникового картографирования многолетней динамики использования пахотных земель на основе восстановленных временных серий данных Landsat (на примере Амурской области)
С 2022 г. Министерство сельского хозяйства Российской Федерации реализует проект по установлению границ и формированию федеральной карты-схемы земель сельскохозяйственного назначения (ЗСН) в рамках Государственной программы «Эффективное вовлечение в оборот земель сельскохозяйственного назначения и развития мелиоративного комплекса», утвержденной постановлением Правительства от 14 мая 2021 г. № 731. Работа выполняется в соответствии с «Методикой установления границ земель сельскохозяйственного назначения и границ зон сельскохозяйственного использования в составе земель населенных пунктов (с установлением границ угодий)», разработанной Государственным университетом по землеустройству и одобренной протоколом заочного заседания секции аграрного образования и сельскохозяйственного консультирования Научно-технического совета Минсельхоза России от 30 января 2023 г.
Согласно Методике, данные спутниковых наблюдений наряду с различными картографическими материалами (архивная землеустроительная документация, данные Единого государственного реестра недвижимости и др.) являются одним из источников сведений о землях сельскохозяйственного назначения. В частности, они используются при картографировании динамики использования пахотных земель за период с середины 1980 х по 2016 гг. (интервалы наблюдения — 1984–1990, 1991–1995, 1996–2000, 2001–2005, 2006–2010, 2011–2016 гг.).
Ранее в рамках работ предыдущего года были описаны автоматические методы и представлены результаты построения тридцатилетних временных серий карт используемой пашни регионов России на основе данных спутниковых систем серии Landsat. При переносе технологии на ряд регионов, характеризуемых очень низкой и изменчивой частотой повторных наблюдений в течение ряда лет, методы восстановления временных серий безоблачных изображений потребовали дальнейшего развития. В частности, продукты уровня L2 для спутниковых систем Landsat-4 и Landsat-5 обеспечивали лишь треть от номинальной частоты повторных наблюдений для территории Амурской области, которая при этом кратно превышала среднюю площадь европейских субъектов РФ.
Для учёта пространственной вариабельности частоты исходных наблюдений был разработан адаптивный алгоритм весовой гармонической регрессии временных серий, который учитывает число наблюдений в целевом интервале для каждого пикселя. Перед началом построения производится стратификация территории и для каждой страты определяется оптимальная комбинация ширины временного окна и числа гармоник, начиная от наименьшей плотности наблюдений до наибольшей. Наименьшей плотности наблюдений соответствует максимальная ширина окна и наименьшее число гармоник, а наибольшей плотности — минимальная ширина окна и наибольшее число гармоник. Конкретные краевые значения зависят от условий наблюдения целевых лет, для которых производится восстановление. Оптимальная комбинация определяется близостью регрессионной кривой к исходным наблюдениям целевого года в терминах среднеквадратического отклонения. На рисунке 1 приведен пример восстановления временных серий NDVI на основе трёхлетнего окна с двумя и тремя гармониками, где вариант с тремя гармониками оказывается наиболее оптимальным, поскольку минимизирует ошибку восстановления для целевого года.
Рисунок 1 — Пример восстановления временных серий на основе трехлетнего окна для трёх (вверху) и двух (внизу) гармоник
Восстановленные временные серии ежедневных наблюдений использовались для создания месячных композитных изображений в интервале с апреля по октябрь каждого года. Пример разновременного синтеза месячных композитных изображений NDVI на основе адаптивного алгоритма весовой гармонической регрессии на юг Амурской области приведен на рисунке 2.
Рисунок 2 — Разновременной синтез месячных композитных изображений NDVI (RGB: май – июнь – июль) за 1986 г. на территорию юга Амурской области в интерфейсе системы Вега
Для автоматического распознавания земель с признаками распашки или сева сельскохозяйственных культур в течение трёхлетнего временного отрезка был использован метод Random Forest, обученный на разметке пахотных земель современного состояния (2020–2022) с использованием, в том числе, спутниковых данных Sentinel-2 (MSI). При создании разметки было использовано следующее определение: пашня — участок земной поверхности, имеющий в течение трёх лет наблюдений признаки распашки, выращивания яровых сельскохозяйственных культур (озимые культуры на рассматриваемой территории не распространены) с минимальным размером не менее 30 м, не находящийся под крышами теплиц и другими объектами или сооружениями, препятствующими дистанционному наблюдению.
Для автоматизированной работы методов распознавания между разновременными наборами признаков, полученными по данным различных приборов программы Landsat, получил дальнейшее развитие метод переноса обучающей выборки. В частности, помимо использования объектного подхода при распознавании целевых классов, автоматически выявляемые объекты применяются при построении характерных значений признаков разделяемых классов. Сопоставление распределений значений признаков производится на основе Q-Q-графиков, что позволяет отождествить распределения с заданным уровнем значимости. Этот подход позволил снизить ошибки сопоставления классов между разновременными наборами признаков.
В целях обеспечения регулярности разновременных оценок, тридцатилетний интервал наблюдений был разбит на шесть пятилетних страт, для каждой из которых была получена карта используемой в течение трёх лет пашни для Амурской области. Анализ временной серии полученных карт позволил идентифицировать последний год использования пашни на уровне отдельных пикселей Landsat (см. рисунок 3).
Рисунок 1.2.2.3 — Интегральные результаты динамического картографирования используемых пахотных земель Амурской области с указанием последнего года использования (вверху), динамика различных оценок целевых категорий используемых земель (слева снизу), а также распределение площадей используемой пашни по дате последнего использования (справа внизу)
Сопоставление серии разновременных оценок площадей используемой пашни с данными Госкомстата СССР и Росстата, а также данных Всероссийской сельскохозяйственной переписи 2006 и 2016 гг. указало совпадение трендов, полученных по данным дистанционного зондирования Земли и из статистических источников. В частности, было подтверждено резкое снижение площади пашни в начале 1990-х гг., когда из оборота было выведено 23 % площадей пахотных земель. Результаты картографирования также подтверждают, что к 2015 г. в обороте осталось чуть более половины площадей используемой пашни Амурской области по отношению к показателю середины 1980-х гг.
Интегральные результаты анализа полученных разновременных карт используемой пашни на Амурскую область, включая дату последнего использования участков и распределение площадей пашни по дате забрасывания, а также сравнение оценок выявленных по данным дистанционного зондирования площадей с данными из различных статистических источников также приведены на рисунке 4.
Рисунок 4 — Схема результатов сопоставления экспертной фотоинтерпретации данных высокого пространственного разрешения и автоматически полученной карты пахотных земель Амурской области для 2013–2015 гг. в узлах регулярной сетки 7×7 км: зелёный цвет — верная классификация, красный цвет — ошибка классификации, оранжевый цвет — карта пахотных земель
Для объективной оценки результатов автоматизированного картографирования была проведена валидация карты пахотных земель Амурской области по состоянию на 2013–2015 гг. С этой целью была использована регулярная сеть точек, покрывающая южную часть Амурской области (всю зону потенциального наличия пашни в регионе) с шагом 7×7 км, в узлах которой проводилась экспертная фотоинтерпретация серии снимков высокого пространственного разрешения. В частности, эксперты использовали указанное выше определение класса пахотных земель и временные серии спутниковых данных Landsat и Sentinel-2. При принятии решения, помимо проверки факта распашки, оценивалась текстура и форма объекта, его приуроченность к инфраструктуре (дорогам, населённым пунктам), местонахождение среди других, в том числе, похожих объектов, наличие севооборота, степень зарастания, наличие овражно-балочной сети или следы заболоченности.
После оценки всего комплекса признаков, эксперт принимал решение об отнесении объекта в узле сети к классу «пашня» или «остальное». Всего на юг Амурской области было проинтерпретировано 4529 точек. На последнем этапе результаты экспертной интерпретации сопоставлялись с автоматически полученной картой с последующим созданием матрицы перепутывания. В результате анализа матрицы перепутывания было установлено, что F-score по классу «пашня» составляет 0,87, F-score по классу «остальное» — 0,99, а общая точность бинарной классификации составляет 0,98.