Loading
Пропустить Навигационные Ссылки.

Авторизоваться
Для зарегистрированных пользователей

Исследование возможности использования методов машинного обучения для автоматической классификации треков спутникового позиционирования на примере системы мониторинга рыболовства

Начиная с 2017 года проводились работы по классификации треков для определения достоверности отчётов о вылове в отраслевой системе мониторинга рыболовства (ОСМ).

В работе 2019 года рассмотрена возможность применения методов машинного обучения для классификации треков судов по спутниковым позиционным данным.

Для применения методов машинного обучения необходимо подготовить значительный объём данных для обучения и проверки. В первую очередь были выбраны только такие треки судов, которые находятся на значительном расстоянии от портов. Среди оставшихся позиций были выделены сутки, в которых у испытуемых судов было более пятидесяти позиций. Данное условие обеспечивало высокую вероятность того, что частота позиционного опроса не менее двух позиций в час. Для первоначальной отработки алгоритма машинного обучения был выбраны суда, имеющие аналогичные характеристики, которые проводили добычу-вылов в Охотском море.

В рамках выделенных тестовых треков, используя результаты предварительной классификации по скорости, визуально определялись участки, когда судно осуществляло траление.

Для удобства визуального выделения на диаграмме участков траления, вспомогательная программа выводит от семи до пятнадцати последовательных фрагментов трека относящихся к разным классам по скорости.
Была получена обучающая выборка, содержащая положительных примеров — 10462, отрицательных — 6050.
Были проведены тесты на основе модели классификации базового уровня (baseline model) с помощью алгоритмов случайный лес и бустинг (реализация - библиотека xgb). Оптимизируется метрика accuracy (Accuracy = (TP+TN)/(TP+TN+FP+FN) where: TP = True positive; FP = False positive; TN = True negative; FN = False negative).

Для борьбы с переобучением используется метод перекрёстной проверки (cross validation) с разбиением на 3 части.

В зависимости от параметров алгоритма обучения результат совпадения составляет 70–65 %. Таким образом, были разработаны и протестированы алгоритмы подготовки обучающей выборки и проведения машинного обучения автоматической классификации треков.