Колумнисты

Ученые выяснили, как внедрить машинное обучение для мониторинга морского мусора

Загрязнение морских акваторий признано проблемой мирового масштаба, и для ее решения необходимо вести его постоянный мониторинг. Непосредственное обнаружение мусора осложняется большим его разнообразием и степенью деградации, а также частичным погружением и визуальным слиянием с водной поверхностью. В последнее десятилетие в этой области наметился значительный прогресс за счет обработки данных с помощью машинного метода глубокого обучения. Научная группа ученых из МФТИ и Института океанологии имени П. П. Ширшова РАН проанализировала достижения и перспективы применения искусственного интеллекта для улучшения методов обнаружения и классификации мусора.

Результаты работы опубликованы в журнале «Океанологические исследования». Несколько десятилетий пластиковые отходы, стекло, металл и другие виды мусора активно накапливаются на побережьях, в водной среде, а также собираются в большие океанские мусорные пятна. При этом пластик составляет от 68 до 96 процентов загрязнений. Фрагменты пластикового мусора могут становиться ловушками для рыб и других водных организмов, угрожают гидросфере и ее биоразнообразию, особенно в морях Арктики. Потенциальное нарушение экологической устойчивости делает решение этой проблемы все более актуальным.

Согласно международной классификации, к макромусору относят частицы размером более 2,5 сантиметра. Наиболее полные наблюдения за загрязнениями проводятся с научных судов в качестве попутных исследований. Есть и другие методы исследований, однако они еще более ограничены в применимости. Визуальное обнаружение трудо- и времязатратно и требует специальных навыков от наблюдателей, поэтому применяется нечасто и охватывает незначительные площади. Автоматизация этого процесса может способствовать массовому внедрению наблюдений на морских судах, для чего потребуется лишь установка камеры в носовой части судна и специализированное программное обеспечение.

Реализация этой схемы в морских условиях, несмотря на кажущуюся простоту, на практике довольно сложна технически. Для универсальности процесса ученые рассмотрели различные ключевые аспекты существующих методик с акцентом на обработку данных с применением методов машинного обучения.

«В Мировом океане сейчас действительно идет активное накопление как плавающего мусора, так и отходов, которые накапливаются на дне или дрейфуют в толще воды. Почему мы концентрируемся на плавающем? Мы ищем “потерянное в свете фонаря”. За счет хороших камер на научных судах мы можем ежесекундно снимать поверхность моря, а затем нейросетевыми методами искать макро мусор размером от 2,5 сантиметров. На фотографиях большого разрешения он уже виден.

Этот мусор вызывает большие проблемы. Например, нарушает баланс экосистем за счет переселения видов, которые используют пластик в качестве субстратов — предметов, на которых живые организма или бактерии могут закрепиться и успешно размножаться. Также остро стоит проблема запутывания морских обитателей в плавающих обрывках сетей. В итоге проблем много, а задача адекватного наблюдения полноценно не решена», — рассказал о проекте Михаил Криницкий, старший научный сотрудник Института океанологии имени П. П. Ширшова РАН и заведующий лабораторией машинного обучения в науках о Земле МФТИ.

Сбор данных сегодня идет с помощью визуальных наблюдений (с морских судов, самолетов), траления, а также дистанционного зондирования, особенно с использованием радиолокационных систем.

Одним из важнейших этапов каждой методики является набор данных, характеризующих плотность распределения мусора по поверхности воды, локализацию мест скопления, пути распределения, идентификацию частиц, распределение их по общепринятым категориям. Эта информация важна для принятия впоследствии административных мер по снижению загрязнения. В исследовании ученые уделили особое внимание перспективам применения искусственного интеллекта для совершенствования методов обнаружения объектов на поверхности воды и классификации.

«В первой части нашего исследования мы обобщили методы наблюдений, которые сейчас применяются. Непосредственное визуальное наблюдение на борту научных судов достаточно достоверное, но локальное. Есть более масштабные методы мониторинга, например, из космоса. Но на снимках из космоса сами частички мусора не видны, но их наличие меняет отражающие характеристики поверхности. Правда, это касается уже достаточно весомых объектов. В итоге можно с уверенностью сказать, что нам пока не хватает существующих наблюдательных миссий для составления полноценной картины загрязнения Мирового океана», — подчеркнул Михаил Криницкий.

Вторая часть исследования посвящена применяемым методам обработки данных. Работа сфокусирована в основном на компьютерных методах, а именно машинном обучении и его подвидах: глубоком обучении, классических методах компьютерного зрения и других.

В настоящее время также ведется разработка мобильных приложений для оптимизации визуальных наблюдений. Например, в 2019 году в ходе экспедиции параллельно с визуальными наблюдениями было протестировано мобильное приложение Floating Litter Monitoring (FLM), которое может использоваться для упрощения и стандартизации сбора визуальных данных о плавающем морском мусоре. Приложение позволяет записывать координаты встреченных объектов и сопутствующие метаданные, создавать перечень мусора и делать его классификацию по категориям.

«В ходе нашего исследования мы пришли к неожиданному выводу, что современные нейросетевые методы сейчас редко применяются для детектирования морского макро мусора. В исследованиях чаще применяются методы классического машинного обучения, которые в целом не очень хорошо работают со снимками, а также классические методы компьютерного зрения. Но в большинстве случаев эти методы либо устаревшие, либо применяются к неадекватным данным, что значимо снижает качество результатов. Например, если говорить об обучении нейросетей, в первую очередь мы должны настроить ее для поиска мусора на поверхности моря.

Для этого используется обучающая выборка. Необходимо четко показать разнообразие объектов, которые следует учитывать. Но таких данных — размеченных — очень мало. Для того, чтобы получить подобные фото, нередко искусственно разбрасывают мусор на поверхности моря и получают обучающую выборку. Мусора действительно много, но если идти на судне по морю, его просто не видно. Мусор не разбросан по океану равномерно, он скапливается в определенных местах отчасти оттого, что в океане есть система течений, которая его переносит и накапливает», — дополнил Михаил Криницкий.

У ученых первый район в фокусе исследований — это Северная Атлантика и Арктика, неустойчивые и экологически уязвимые регионы. Парадоксально, но именно в них найти мусор достаточно проблематично. Размер области, которую наблюдает человек с борта судна очень сильно ограничен — примерно 20–30 метров. Поэтому плотность морского мусора, который обнаружен с применением нейросетей, следует экстраполировать на площадь акватории моря, котором проведено наблюдение. Это следующая сложная статистическая задача.

«За весь рейс в Арктике, а это 12–13 дней, мы наблюдали порядка десятков экземпляров, максимум 70. Это очень немного, тем более для обучения нейросети. На камере этих объектов еще меньше: человеческий глаз более зоркий и может оценить мусор в движении на морской поверхности. Таким образом, проблем для масштабного учета нейросети больше, чем кажется, и требуется реализовывать дополнительные методы для обучения», — рассказала Ольга Белоусова, исследователь лаборатории машинного обучения в науках о Земле МФТИ.

Таким образом, ученые в исследовании преследуют решение двух больших задач. Естественнонаучная — необходимо оценить в выбранных акваториях плотность и динамику изменения плотности плавающего морского мусора, а также расположение и мощность источников. Вторая — техническая: необходимо понять, какие методы использовать для обнаружения микрочастиц в условиях попутных морских наблюдений с борта исследовательского или коммерческого судна. Для этого были предложены методы обнаружения на фотографиях. Также ученые активно работают над разработкой стандартов наблюдений за плавающим морским мусором. Несмотря на весьма острую экологическую проблему, универсального и принятого всеми стандарта не существует, есть только первые наработки для унификации методик наблюдений и подсчета.