Развитие метода оценки проективного покрытия древесного полога леса
Проективное покрытие древесного полога леса (ППДПЛ) является одной из ежегодно оцениваемых характеристик растительного покрова в результате обработки спутниковых данных MODIS. За отчётный период предложенный ранее метод оценки ППДПЛ претерпел существенные изменения. Изменения коснулись построения опорной выборки значений ППДПЛ, метода восстановления регрессии и используемого набора данных при постобработке результатов восстановления характеристик. Текущая версия метода оценки ППДПЛ представляет собой последовательное выполнение трех этапов: построение обучающей выборки, настройки и применения регрессионной модели и постобработки результата.
Рисунок 1 — Недостатки исходных опорных данных Tree Cover 2010
Проведён анализ построенных рядов ППДПЛ и их сравнение с другими источниками данных о пространственном распределении лесов. Оказалась, что большие по площади массивы редкой лиственницы и кустарника имеют нулевое проективное покрытие полога леса по данным Tree Cover 2010, используемых в качестве опорных при оценке ППДПЛ (рисунок 1).
Такого рода участки расположены достаточно локально. Поэтому несмотря на проводимую локальную статистическую фильтрацию исходных опорных данных, указанные особенности существенно влияют на получаемый результат и приводят к недооценке проективного покрытия и лесистости на территориях, покрытых редкой лиственницей и кустарником. Для исключения подобных участков из опорной выборки использовано композитное изображение с пространственным разрешением 30 м, построенное для территории нашей страны на основе ежедневных данных Sentinel-2 с наличием снежного покрова на земной поверхности. Метод построения изложен в предыдущем разделе и для его создания были использованы данные 2018, 2019 и 2020 гг. с начала января по конец апреля.
Схема построения опорной выборке ППДПЛ представлена на рисунке 2. Основным приёмом построения обучающей выборки по уже имеющимся непрерывным опорным данным ППДПЛ является пространственная статистическая фильтрация. Она представляет собой просеивание выборки, собранной на некоторой заданной территории на основе порогов, построенных по распределению анализируемых признаков. Первый шаг метода построения обучающей выборки состоит в использовании глобальной статистической фильтрации для построения маски согласованных с данными высокого пространственного разрешения пикселей. Исходные значения ППДПЛ из карты Tree Cover 2010 группируются с шагом 5 % в 20 классов. Для каждого класса строится плотность распределения значения признака, на основе которого вычисляются пороги для отсечения выбросов. Из исследуемого класса удаляются пикселы, значения в которых выходят за построенные пороги. В качестве признаков были использования красный и ближний инфракрасный каналы композитного изображения Sentinel-2.
Рисунок 2 — Блок-схема метода построения опорной выборки ППДПЛ
Построенная после глобальной фильтрации маска пикселей высоко разрешения применяется для удаления из обучающей выборки по данным MODIS (230 м) тех пикселей, в которых доля отфильтрованных по данным Sentinel-2 пикселей велика (превышает 20 % площади) (см. рисунок 2).
Вторым этапом формирования обучающей выборки является локализованная статистическая фильтрация в узлах регулярной сети. Территория страны покрывается сетью ячеек с узловыми точками в их центре с шагом 46 км. Для каждого узла сети в некоторой в окрестности собирается обучающая выборка, на основе которой аналогично фильтрации на предыдущем этапе строится распределение значений признаков и вычисляются пороги. С помощью построенных порогов происходит удаления элементов из выборки. Ранее этот этап проходил без участия данных о преобладающих породах. Теперь фильтрация производится независимо для каждого класса карты пород и для нелесных территорий, что позволяет обеспечить локальную пространственную представительность малочисленных классов в результирующей выборке. В результате вычислений, выполненных на данном этапе строится очищенная опорная выборка значений ППДПЛ, используемая при построении регрессионной модели. В финальную опорную выборку после проведения фильтрации попало около 30% территории (15,67 % занимают леса, 24,3 % — нелесные земли).
Схема метода настройки и применения регрессионной модели для оценки ППДПЛ представлена на рисунке 3. Для оценки ППДПЛ используется пространственно-распределённая по территории страны регрессионная модель. Территория страны покрывается сетью ячеек с шагом 46 км. Настройка модели происходит независимо для каждой ячейки на основе опорной выборки, собранной в некоторой окрестности от её центра. В качестве модели регрессии используется широко известный метод случайного леса, предложенный Л. Брейманом и А. Катлер. Метод случайного леса представляет собой построение ансамбля решающих деревьев и агрегацию полученных на их основе прогнозов оценок. Использование метода случайных лесов вместо линейной модели для восстановления регрессионных зависимостей позволяет существенно повысить точность настройки модели, а также даёт возможность использовать не только количественные, но и тематические признаки в качестве входных параметров.
Рисунок 3 — Блок-схема настройки и применения регрессионной модели для оценки ППДПЛ
Построение оценок ППДПЛ происходит двухактно, с участием и без участия данных о породном составе. В качестве признаков используются красный и ближний инфракрасный каналы данных MODIS 2010 г. Введение данных о преобладающих породах в качестве признака на этапе построения регрессионной модели помогает компенсировать различия между проективным покрытием полога леса листопадных пород в летний и зимний периоды по сравнению с вечнозелёными лесами, а также учесть различия между сомкнутостью полога для лесов разными преобладающими древесными породами. В таблице 1 показаны значения статистики распределения коэффициента детерминации для построенных моделей регрессии.
Таблица 1 — Статистики ошибки оut-of-bag error (OOBE) и коэффициента детерминации R2 для регрессионных моделей ППДПЛ
Статистики
|
Минимум
|
Максимум
|
Среднее значение
|
Медиана
|
R2
|
без учёта карты пород
|
0,66
|
0,96
|
0,95
|
0,957
|
с учётом карты пород
|
0,69
|
0,97
|
0,955
|
0,96
|
OOBE
|
без учёта карты пород
|
5,5
|
8,5
|
6,86
|
6,74
|
с учётом карты пород
|
5,8
|
9,2
|
7,16
|
7,04
|
Два временных ряда оценок объединяются на этапе пост обработки. Схема этапа постобработки представлена на рисунке 4. Выбор метода слияния двух временных рядов был продиктован принципом, что результирующее изображение должно быть пространственно-непрерывно, но при этом важно учитывать породный состав территории на тех лесных территориях, где он сильно оказывает влияние на результат оценки проективного покрытия. Поэтому выбрана следующая модель коррекции: значения корректируются только на лесных пикселях или пограничных с лесом территориях, где разница между полученными оценками существенна. Величина коррекции пропорционально доле ППДПЛ в данном пикселе (см. рисунок 4).
Рисунок 4 – Пример зависимости КСЯ спектральных каналов MODIS и проективного покрытия крон
Маскирование непокрытых лесов территорий является вынужденной мерой, корректирующей влияние рельефа местности в горных районах, а также компенсирующей недостатки композитных изображений с наличием снежного покрова на юге России и в Крыму. Для построения непокрытых лесов территорий используются карты растительного покрова России, построенные в ИКИ РАН, карты GlobeLand30 2010 и 2020 гг., данные Tree Cover 2000 и 2010. На основе перечисленных источников данных строится попиксельная маска непокрытых лесом территорий с пространственным разрешением 30 м. Полученная маска приводится к пространственному разрешению данных MODIS для получения оценки доли площади пикселя заведомо непокрытой лесом. Затем выполняется коррекция оценок ППДПЛ в зависимости от полученных значений оценок ППДПЛ и доли площади непокрытой лесом в пикселе. На финальном шаге производится сглаживание построенного ряда карт ППДПЛ по времени с окном размером три года.
Предложенный метод позволяет поводить регулярные оценки ППДПЛ на территории страны и открывает возможность непрерывного наблюдения за процессами, происходящими в лесах в течение продолжительного времени.