Анализ информативности спектральных вегетационных индексов для спутникового картографирования открытых песков и дефлированных территорий Северо-Западного Прикаспия
Нерациональное использование сельскохозяйственных земель на легких по гранулометрическому составу почвах может приводить к их деградации вплоть до полной утраты растительного покрова и верхних почвенных горизонтов в результате интенсификации процессов дефляции. Наиболее широко в исследованиях процессов деградации растительного покрова на основе данных ДЗЗ используются вегетационные индексы (ВИ), особенно NDVI, который характеризуется положительной корреляцией с вегетирующей фитомассой. При этом большая часть работ по идентификации территорий без растительного покрова основывается на пороговых значениях ВИ или коэффициентов спектральной яркости (КСЯ), определяемых по спутниковым данным. Разработано множество различных специализированных ВИ для картографирования открытых почв и песков на основе пороговых значений, но ни для одного из них не существует универсальных величин порогов, которые могли бы применяться на любой территории в течение вегетационного сезона на основе различных источников данных. Также для большей части результатов, получаемых на основе пороговых значений ВИ и КСЯ не применялось процедуры верификации, поэтому степень их неопределённости неизвестна. Методы контролируемой классификации, в том числе на основе машинного обучения, позволяют получать результаты с достаточно высокой точностью, но как для картографирования, так и для проверки точности результатов требуется создание качественной опорной выборки. Одним из возможных источников данных для проверки результатов картографирования открытых песков и настройки соответствующих алгоритмов классификации может выступать аэросъёмка, в том числе с использованием беспилотных летательных аппаратов. Сопоставление площадей открытых песков по данным аэросъёмки, а также КСЯ и ВИ по спутниковым данным дает возможность определения наиболее информативных признаков для последующей классификации спутниковых изображений на основе различных автоматизированных алгоритмов.
Таким образом, проблема определения наиболее информативных показателей при спутниковом картографировании сезонных и многолетних изменений площадей открытых песков и дефлированных территорий достаточно актуальна. Цель исследования, проведенного в отчётный период, заключается в обосновании наиболее значимых индикаторов участков подвижных песков по спутниковым данным. Для этого решались следующие задачи:
- сбор опорных данных на основе аэросъёмки беспилотным летательным аппаратом и наземных наблюдений в течение вегетационного сезона;
- расчёт различных ВИ, предназначенных для анализа состояния растительного покрова или идентификации территорий без растительности, по спутниковым данным Sentinel-2 и Landsat-8, -9;
- сопоставление доли пикселов, занятых открытыми песками со значениями КСЯ и ВИ с расчётом линейного коэффициента корреляции Пирсона и непараметрических ранговых коэффициентов корреляции Спирмена и тау Кендалла;
- определение ВИ и спектральных диапазонов с максимальными по модулю значениями коэффициентов корреляции.
Исследование основывается на сопоставлении площадей открытых песков по данным аэросъёмки в пикселах спутниковых изображений Sentinel-2 с пространственным разрешением 10 и 20 м, а также Landsat-8, -9 с разрешением 30 м. Аэросъёмка выполнялась беспилотным летательным аппаратом DJI Mavic Air в видимом диапазоне с высоты 100 м на территории Ногайского и Тарумовского районов Республики Дагестан 25–27 апреля, 26–28 июля и 25–27 октября 2023 г. По материалам аэросъёмки построены ортофотопланы с пространственным разрешением 3,5 см. В работе использованы данные, полученные в пасмурную погоду в апреле и октябре и с минимальным значением зенитного угла солнца в июле на одних и тех же участках в течение года на общей площади 23,1 га. Выделение открытых песков по данным аэросъёмки проводилось кластеризацией ортотрансформированных изображений с последующей группировкой соответствующих пескам кластеров на основе экспертной оценки.
Спутниковые изображения второго уровня обработки, прошедшие процедуру коррекции атмосферных искажений, и метеоданные получены с использованием сервиса «Вега-Science» и ЦКП «ИКИ-Мониторинг». Даты использованных спутниковых данных ДЗЗ подбирались максимально близко к датам аэросъёмки: 26 апреля, 30 июля, 8, 13 октября (Sentinel-2) и 9 мая, 20 июля, 25 октября (Landsat-8, -9). Для каждого пиксела спутниковых изображений была определена площадь открытых песков по данным аэросъёмки на соответствующую дату, также анализировались одновременно данные на все даты. Всего проанализировано 2,3 тыс. пикселов Sentinel-2 с разрешением 10 м, 0,56 тыс. пикселов Sentinel-2 с разрешением 20 м и 0,25 тыс. — Landsat с разрешением 30 м.
В работе анализировались 45 различных индексов, которые используются для оценки состояния растительности (NDVI, EVI, SAVI, MSAVI), идентификации открытых почв (GVI, NDESI, NDSAI, MNDBSI, NBR2 и др.), застроенных территорий (BUI, NBAI, NBI и др.) и повреждений растительного покрова, в том числе 13 из них могут быть рассчитаны по данным Sentinel-2 с разрешением 10 м, а остальные 32 используют коротковолновый инфракрасный диапазон, которому соответствуют данные Sentinel-2 с разрешением 20 м. Расчёт коэффициентов корреляции Пирсона, ранговой корреляции Спирмена и Кендалла (тау) осуществлялся с помощью модуля scipy.stats библиотеки SciPy языка программирования Python. Также применялся ансамблевый метод регрессии Random Forest, реализованный на языке Python, на основе которого была предпринята попытка определения доли открытых песков в пикселах спутниковых изображений с оценкой точности (коэффициента детерминации R2 и среднеквадратического отклонения (СКО, RMSE)) и наиболее информативных признаков.
В результате сопоставления площадей открытых песков в пикселах спутниковых изображений Sentinel-2 с пространственным разрешением 10 и 20 м, Landsat-8 с разрешением 30 м, значениях КСЯ в разных спектральных диапазонах и рассчитанных на их основе ВИ получены коэффициенты корреляции Пирсона, Спирмена и Кендалла (таблица 1), практически все из которых значимы (p < 0,001).
В результате применения метода непараметрической регрессии Random Forest получены оценки точности определения площади открытых песков в пикселах спутниковых изображений на основе КСЯ всех спектральных диапазонов и использованных ВИ. Для всех данных значения R2 превысили 0,8 (рисунок 1), а СКО составляет не более 12 %, что соответствует достаточно высокой точности регрессии. При этом и данные КСЯ, и представленные выше ВИ обладают высокой информативностью и взаимозаменяемостью при использовании этого метода регрессии.
Таким образом, можно рекомендовать для картографирования открытых песков КСЯ видимого диапазона и NDVI по данным Sentinel-2 с пространственным разрешением 10 м, а для данных Sentinel-2 с разрешением 20 м и Landsat рекомендуются ВИ, основанные на КСЯ видимого и инфракрасного коротковолнового диапазона. В весенний период сила связи с площадями открытых песков выше, чем летом и осенью, для всех исследованных источников данных ДЗЗ и получаемых на их основе КСЯ и ВИ. Метод регрессии Random Forest также демонстрирует весной большую точность. Это может быть связано с активной вегетацией растительности в летний период и значительной мортмассой осенью 2023 г., в то время как весной растительный покров был более однороден. Состояние растительного покрова, маскирующего поверхность открытых песков, вносит существенную неопределённость при их картографировании, из-за чего возрастает роль данных в коротковолновой области спектра. Соответственно, ВИ, использующие этот диапазон, являются более информативными. Также для определения доли площади открытых песков в пикселах спутниковых изображений достаточно высокую информативность продемонстрировали индексы для идентификации застроенных территорий: BAEI, BUI, NBAI, NBI. Они рассчитываются по КСЯ видимого и коротковолнового инфракрасного диапазонов, ВИ на основе которых характеризуются высокой эффективностью при картографировании открытых песков. При этом индекс MBI, который предназначен для разделения застройки и открытых почв, не показал в данном исследовании преимуществ перед остальными.
Таблица 1 — Наиболее информативные показатели при определении доли открытых песков в пикселах спутниковых изображений (числитель), максимальные или минимальные значения коэффициента корреляции (знаменатель)
|
Корреляция
|
Период
|
Вегетационные индексы и спектральные каналы
Коэффициент корреляции
|
|
Максимальные значения
коэффициентов корреляции
|
Минимальные значения
коэффициентов корреляции
|
|
Sentinel
-2, 10 м
|
Sentinel
-2, 20 м
|
Landsat,
30 м
|
Sentinel-
2, 10 м
|
Sentinel-
2, 20 м
|
Landsat,
30 м
|
|
Пирсона
|
Весна
|
Green
0,89
|
NDSI
0,96
|
BUI
0,96
|
NDVI
–0,91
|
NDSAI
–0,96
|
NDSAI
–0,95
|
|
Лето
|
Blue
0,84
|
BUI
0,89
|
NBAI
0,84
|
PV
–0,77
|
NDSAI
–0,88
|
NBR2
–0,84
|
|
Осень
|
Blue
0,85
|
NDSDI
0,90
|
BI2
0,88
|
NDVI
–0,8
|
NDSAI
–0,88
|
PV
–0,85
|
|
Все даты
|
Blue
0,85
|
BAEI
0,89
|
GVI2
0,82
|
NDVI
–0,66
|
NDSAI
–0,87
|
NDSAI
–0,67
|
|
Спирмена
|
Весна
|
Green
0,90
|
BUI
0,94
|
NDESI
0,94
|
NDVI
–0,85
|
NDSAI
–0,93
|
NBR2
–0,94
|
|
Лето
|
Blue
0,81
|
BUI
0,89
|
BUI
0,81
|
PV
–0,73
|
NDSAI
–0,88
|
NBR2
–0,81
|
|
Осень
|
Blue
0,85
|
NDSDI
0,90
|
NBI
0,88
|
NDVI
–0,81
|
NDSAI
–0,89
|
NDVI
–0,87
|
|
Все даты
|
Blue
0,84
|
BAEI
0,89
|
GVI2
0,83
|
NDVI
–0,76
|
NDSAI
–0,87
|
NDSAI
–0,7
|
|
Тау Кендалла
|
Весна
|
Green
0,72
|
BUI
0,80
|
NDESI
0,8
|
NDVI
–0,68
|
NDSAI
–0,79
|
NBR2
–0,79
|
|
Лето
|
Blue
0,62
|
BUI
0,72
|
SWI
0,63
|
PV
–0,55
|
NDSAI
–0,70
|
NBR2
–0,63
|
|
Осень
|
Blue
0,66
|
BAEI
0,73
|
NBI
0,71
|
NDVI
–0,61
|
NDSAI
–0,72
|
NDVI
–0,68
|
|
Все даты
|
Blue
0,66
|
BAEI
0,72
|
GVI2
0,64
|
NDVI
–0,56
|
NDSAI
–0,69
|
NDSAI
–0,54
|
Проведённые исследования показали достаточно высокую информативность вегетационных индексов, основанных на КСЯ видимого и коротковолнового инфракрасного диапазонов, при картографировании открытых песков в Северо-Западном Прикаспии. В зависимости от используемых спутниковых данных и состояния растительного покрова могут быть рекомендованы разные ВИ и спектральные диапазоны.
Для спутниковых данных Sentinel-2 с пространственным разрешением 10 м, которые представлены КСЯ видимого и ближнего инфракрасного диапазонов, схожую информативность имеют КСЯ всех видимых спектральных каналов, при этом весной несколько предпочтительней зелёный, летом и осенью — голубой, а наиболее универсальными являются голубой и красный. Среди ВИ с разрешением 10 м лучшие результаты продемонстрировали NDVI и PV. Наиболее оптимальным сочетанием будет применение данных КСЯ красного диапазона и NDVI, который рассчитывается с использованием КСЯ красного и ближнего инфракрасного диапазонов спектра. Сила связи КСЯ красного канала и площади открытых песков практически не отличается от других видимых диапазонов спектра, но так как красный используется для расчёта NDVI, его применение предпочтительно.

Рисунок 1 — Сопоставление результатов применения регрессии Random Forest для определения площади открытых песков в пикселах спутниковых изображений с проверочными данными аэросъёмки по всем датам: а — Sentinel-2 с разрешением 10 м; б — Sentinel-2 с разрешением 20 м; в — Landsa
Для спутниковых изображений Sentinel-2 с пространственным разрешением 20 м, по которым доступны данные коротковолнового инфракрасного диапазона спектра, наиболее информативны ВИ, рассчитываемые с их использованием. Например, специально разработанный для идентификации песчаных почв NDSAI, а также индексы BAEI и BUI, применяемые при картографировании застроенных территорий. Эти индексы демонстрируют более сильную связь с площадями открытых песков в пикселах по сравнению с КСЯ отдельных спектральных каналов и NDVI, но их применение влечет снижение пространственного разрешения.
При использовании данных Landsat-8, -9 рекомендуются ВИ GVI1, GVI2, NBR2 и NDSAI. Из-за более низкого пространственного разрешения спутниковых изображений Landsat сила связи ВИ и площади открытых песков ниже по сравнению с Sentinel-2. Это связано с ростом неоднородности почвенно-растительного покрова в пикселах спутниковых изображений более низкого пространственного разрешения.
Состояние растительности может вносить существенную неопределённость при картографировании открытых песков по данным ДЗЗ. В этом исследовании наиболее тесная связь ВИ отмечена весной, в период, когда эфемеры и эфемероиды уже закончили вегетацию, виды-эдификаторы были угнетены из-за неблагоприятных гидротермических условий весны и стравливания домашним скотом, а однолетники ещё не начали активную вегетацию. Летом в период наибольшей фитомасссы однолетников и осенью из-за накопления мортмассы сила связи ВИ и площади открытых песков существенно снизилась. Таким образом, не существует универсальных пороговых значений для вегетационных индексов при картографировании открытых песков. Но выявленные наиболее информативные показатели могут быть рекомендованы к применению при картографировании открытых песков и дефлированных территорий в качестве признаков и основы для составления обучающей выборки для различных методов машинного обучения, например, ансамблевого алгоритма Random Forest и других.