Разработка информационных продуктов о частоте наблюдения типов поверхности на основе данных спутников Sentinel-2
В 2025 г. на основе информации прибора MSI спутников Sentinel‑2 был расширен набор продуктов, описывающих частоту детектирования различных типов земной поверхности. Набор опубликован на ресурсах Центра коллективного пользования «ИКИ‑Мониторинг» и доступен для решения различных научных и прикладных задач. Работа с полученными продуктами, в том числе в интерактивном режиме, организована в уникальной научной установке (УНУ) «Вега‑Science» (http://sci-vega.ru/). Набор включает информационные продукты, созданные на основе классификации каждой сцены алгоритмами Sen2Cor (ранее созданный набор, расширенный в 2025 г.) и Dynamic World (набор, впервые сформированный в 2025 г.).
Sen2Cor для каждой сцены и для каждого пикселя указывает один из 11 классов: три класса облачности, «тени от облаков», «тёмные объекты», «растительность», «не растительность», «вода», «не классифицировано», «нет данных» и «сбои». Для получения данных на основе алгоритма Sen2Cor ранее было организовано автоматическое поступление, обработка и сохранение данных в архивы ЦКП «ИКИ-Мониторинг» из Google Cloud Storage. Данные имеются за период с конца 2018 г.
Dynamic World классифицирует каждый чистый пиксель каждого изображения по одному из девяти классов земного покрова: «водные объекты», «обводнённая растительность», «древесная растительность», «травянистая растительность», «сельскохозяйственные угодья», «кустарники», «постройки», «открытые почвы», «снег и лёд». Кроме того, для каждого пикселя предоставляется вероятность того, что он относится к каждому из перечисленных классов. В настоящей работе эта вероятность не учитывалась, а использовался только наиболее вероятный класс. Поступление данных Dynamic World в архивы ЦКП «ИКИ-Мониторинг» было организовано с помощью возможностей системы Google Earth Engine. Данные имеются за период с 2016 года.
Технология построения набора данных основана на результатах отнесения каждого пикселя каждой сцены к определённому типу земной поверхности за заданный период времени. Для каждого пикселя по разработанной технологии вычислялись: абсолютное число отнесений его к каждому типу поверхности за рассматриваемый период и доля таких отнесений (в %) от общего числа безоблачных (чистых) измерений. Дополнительно определялись наиболее часто встречающееся значение класса за период и общее число чистых измерений.
Для продуктов на основе Dynamic World все девять классов считались чистыми. В результате по Dynamic World за каждый период сформировано 18 основных продуктов об абсолютном и относительном отнесении пикселя к каждому из 9 классов. Для продуктов, основанных на результатах классификации алгоритмом Sen2Cor, в бесснежный период к чистым классам относились «растительность», «не растительность», «вода», «тёмные объекты», «не классифицировано», а в снежный период дополнительно учитывался класс «снег». Остальные классы рассматривались как маска. В результате за каждый период времени по Sen2Cor получено 10 основных продуктов, описывающих абсолютное и относительное отнесение пикселя к каждому из 5 чистых классов. Как для продуктов на основе Sen2Cor, так и для продуктов на основе Dynamic World дополнительно были созданы два продукта: с наиболее часто встречающимся классом и общее число чистых измерений за период. В дальнейшем возможно формирование аналогичных информационных продуктов на основе любых других схем классификации каждой сцены.
Таким образом, был создан комплексный набор данных о частоте детектирования типов земной поверхности для обширной территории Северной Евразии общей площадью более 18 млн км2. Перечень основных продуктов приведён в таблице 1. Все продукты, основанные на Sen2Cor, имеют пространственное разрешение 20 м на пиксель, а продукты на основе Dynamic World — 10 м на пиксель. В дальнейшем планируется автоматическое пополнение архива новыми данными за последующие периоды, а также возможное появление аналогичных наборов за дополнительные временные интервалы. Пользователям УНУ Вега‑Science также доступны различные разновременные производные продукты, формируемые из основных по запросу. На рисунке 1 представлены примеры созданных информационных продуктов.
Таблица 1 — Основные опубликованные продукты о частоте наблюдения типов поверхности
|
Периоды
|
Годы
|
Основа
|
Продукты
|
|
15 марта –
15 ноября
|
2019–2024
|
Sen2Cor
|
Число чистых измерений, наиболее часто встречающееся значение, число и процент измерений классов «вода», «тёмные объекты», «растительность», «не растительность»
|
|
1 мая –
30 сентября
|
2019–2024
|
Sen2Cor
|
|
1 января –
31 марта
|
2019–2024
|
Sen2Cor
|
Число чистых измерений, наиболее часто встречающееся значение, число и процент снежных измерений
|
|
15 июля —
15 сентября
|
2019–2024
|
Sen2Cor
|
Число чистых измерений, число водных измерений, процент водных измерений
|
|
15 марта –
15 ноября
|
2016–2024
|
Dynamic World
|
Число чистых измерений, наиболее часто встречающееся значение, число и процент измерений классов «водные объекты», «обводнённая растительность», «древесная растительность», «постройки», «снег и лед», «сельскохозяйственные угодья», «травянистая растительность», «кустарники», «открытые почвы»
|
|
1 мая –
30 сентября
|
2016–2024
|
Dynamic World
|
|
1 декабря –
31 марта
|
2016–2024
|
Dynamic World
|
Прямая оценка точности и валидация полученных продуктов затруднена из-за их статистической природы и отсутствия репрезентативных выборок. Точность оценивалась косвенно, через точность исходных классификаторов. Общая точность продуктов по Sen2Cor в литературе оценивается в 74–84 %, сильно завися от условий. Для Dynamic World общая точность составляет 72–78 % с высокой вариабельностью по классам. Например, получена высокая (более 90 %) точность для воды и застройки, низкая (менее 50 %) для травянистой растительности. Качество выше для умеренных и лесных биомов. Косвенным показателем надёжности для пользователя также является количество чистых измерений в конкретной точке (рисунки 1.C, 1.F), которое существенно варьируется в зависимости от облачности.
Описываемая технология и сформированные на её основе временные ряды информационных продуктов могут быть использованы для изучения объектов и территорий, где важна временная динамика. Благодаря комплексному анализу представленного набора за разные годы качество картографирования таких объектов и территорий может быть повышено. Это особенно актуально для объектов, которые меняются за период наблюдения, например, зон затопления. Кроме того, временная динамика может играть роль в сложных классификациях, где необходимо учитывать сезонные изменения, например, различия между используемыми и неиспользуемыми сельскохозяйственными землями. Для стабильных объектов, таких как постоянно открытая водная поверхность или лесная растительность, наоборот, можно использовать набор данных с порогом разделения. Это позволит считать пиксель относящимся к определённому типу поверхности, если он был идентифицирован как таковой более заданного процента от всех безоблачных измерений в течение сезона.

Рисунок 1 — Примеры продуктов на основе частоты наблюдения типа земной поверхности за период с 1 мая по 30 сентября 2024 г.: А — наиболее часто встречающееся значение на основе Sen2Cor; B — доля (в %) измерений воды от всех чистых наблюдений на основе Sen2Cor; С — число чистых измерений на основе Sen2Cor; D — наиболее часто встречающееся значение на основе Dynamic World; E — доля (в %) измерений класса «древесная растительность» от всех чистых наблюдений на основе Dynamic World; F — число чистых измерений на основе Dynamic World