В Сколтехе разработали новый метод обучения алгоритмов компьютерного зрения на ограниченных наборах данных
Ученые Сколтеха разработали метод обучения алгоритмов компьютерного зрения, повышающий точность обработки данных при наличии ограниченных исходных выборок. Благодаря новому методу решение различных задач дистанционного зондирования станет проще не только для компьютеров, но в перспективе и для пользователей данных.
Результаты исследования опубликованы в журнале Remote Sensing. Методы компьютерного зрения и машинного обучения уже давно используются при решении задач экологического мониторинга: с наиболее трудоемкими из них, которые к тому же подвержены человеческим ошибкам, алгоритмы справляются с большой легкостью. Однако проблема в том, что нейронную сеть сначала необходимо обучить, чтобы она могла, например, успешно различать породы деревьев в лесных массивах.
Существенное отличие спутниковых изображений от обычных фотографий, десятки которых можно ежеминутно делать на смартфон, заключается в том, что за один проход спутника можно получить не так много кадров, при этом не всегда с достаточным разрешением. Кроме того, на качество съемки влияет облачность. Получение достаточного количества хорошо размеченных изображений, пригодных для обучения нейронной сети, может оказаться крайне сложной задачей, для решения которой ученые и инженеры используют, в частности, методы аугментации изображений.
«Нейронная сеть – очень мощная система, требующая использования больших наборов обучающих данных для получения качественных результатов. К сожалению, при решении практических задач мы зачастую сталкиваемся с проблемой нехватки данных, поэтому специалистам по их обработке приходится применять различные методы, чтобы искусственно увеличивать исходные выборки. Одним из самых популярных методов является аугментация данных – преобразование изображений для повышения вариативности выборки», − рассказывает один из авторов статьи, аспирант Сколтеха Сергей Нестерук.
Профессор Сколтеха Иван Оселедец и его коллеги разработали метод аугментации данных MixChannel, который можно применять к мультиспектральным спутниковым изображениям. В его основе лежит принцип подстановки данных: на место полосы в исходном изображении подставляется полоса полученного в другое время изображения того же участка земной поверхности.
«Использование метода аугментации данных в случае с обычными изображениями RGB не представляет особой трудности, а вот эффективного средства аугментации сложных мультиспектральных данных до сих пор не было. MixChannel – принципиально новый метод аугментации, предназначенный именно для работы с мультиспектральными данными», − отмечает соавтор статьи, аспирант Сколтеха Светлана Илларионова.
Для проверки работы нового метода ученые использовали изображения бореальных хвойных и лиственничных лесов Архангельской области, полученные со спутника Sentinel-2. На них исследователи обучали сверточную нейронную сеть классифицировать данные типы лесов. «Прямой метод обучения классификационной модели на основе сверточной нейронной сети заключается в использовании набора спутниковых изображений заданной территории, полученных в течение активного вегетационного периода.
Для создания обучающего набора данных используется фрагмент, выбранный случайным образом из крупного изображения, – отмечают авторы. – Однако, если проверять полученную модель на изображении, полученном в день, который не вошел в обучающий набор, точность модели может резко снижаться».
Поскольку над территорией Архангельской области часто присутствует облачность, пригодных для использования спутниковых снимков оказалось очень мало – всего шесть, но даже при такой ограниченной выборке новый метод по результатам тестирования на трех нейронных сетях превзошел самые современные решения. Как подчеркивают авторы, разработанный ими метод можно применять в сочетании с другими методами аугментации, что позволит получать еще больше обучающих данных.
Новый метод целесообразно использовать и для решения других задач, связанных с применением данных дистанционного зондирования Земли, в частности, для экологических исследований, точного земледелия и любых других задач, где имеется ограниченное количество изображений со средним пространственным разрешением. В дальнейшем ученые планируют доработать свой метод, обеспечив возможность обработки изображений различных типов земного покрова и более обширных территорий с различными природными условиями.
В исследовании приняли участие ученые из Космического центра, Центра по научным и инженерным вычислительным технологиям для задач с большими массивами данных (CDISE) и Лаборатории цифрового сельского хозяйства (DAL) Сколтеха.
Каждый год на месторождениях происходят десятки плановых остановок скважин для ремонта или профилактики. Чтобы во время простоев предотвратить выброс нефти и газа на поверхность, скважины глушат и закачивают в них специальные жидкости, в качестве которых нередко используют обратные эмульсии. Раньше считалось, что они безвредны и легко удаляются, поэтому, когда после глушения проницаемость уменьшалась, это списывали на другие факторы — например, отложение парафинов. Комплексно не изучалось, как именно эти составы влияют на снижение добычи. Ученые Пермского Политеха изучили обратные эмульсии и впервые объяснили, как они влияют на проницаемость горных пород. Проведенное исследование позволяет заранее определить, насколько опасен тот или иной состав и какой способ очистки сработает лучше. Это поможет нефтяным компаниям минимизировать потери добычи и избежать дорогостоящих восстановительных работ.
Переход к оседлой жизни и выращиванию кукурузы на юге Анд оказался историей затяжного кризиса. Международная группа ученых выяснила, как местные сообщества и группы мигрантов сообща пытались пережить последствия этой трансформации.
Большой взрыв мог быть не началом Вселенной, а моментом рождения самой гравитации в привычном нам виде. Новая модель предлагает иную, квантовую форму гравитации, которая могла запустить инфляцию и избавить космологию от проблемы сингулярности, где законы физики перестают работать.
Генетика интеллекта сложна и связана с разными психоневрологическими состояниями. Оказалось, то, что повышает эрудицию, может ухудшать способность решать творческие задачи, — и наоборот. Причем паттерны этих связей уникальны для каждого диагноза.
Ученые давно сделали вывод о том, что в поздней Античности монеты перестали представлять собой цену как валюта, однако не было понятно когда именно это произошло. Новое исследование погребения римского воина из бельгийского форта Оденбург показало, в какой момент монеты стали цениться просто весом металла в кошельке.
Релиз довольно неожиданно перенес время образования протонов и нейтронов в более раннее прошлое Вселенной. К сожалению, из его текста осталось неясным научное обоснование таких фундаментальных изменений в космологии. Также он резко передвинул в прошлое и момент возникновения реликтового излучения.
В последнее время пуски с российских северных космодромов осуществляют без предварительного уведомления, чего не было в прошлом. Вероятно, дело в недавно упомянутых главой «Роскосмоса» атаках на Плесецк во время пуска. Сегодняшний запуск обеспечил вывод на орбиту космических аппаратов военного назначения.
Четыре человека, летящие к Луне, столкнулись с целым рядом мелких неприятностей — от низкой температуры в начале работы до поломки мочевыводящей системы туалета на вторые сутки и необходимости взамен пользоваться пакетами. К счастью, пока самые крупные сложности удалось компенсировать. Но все они вместе могут сдвинуть ситуацию к решению, о котором Naked Science уже говорил в нашем видеоподкасте о миссии: не исключено, что при высадке астронавтов на Луне их корабль состыкуют со Starship не на окололунной, а уже на околоземной орбите.
Когда международная экспедиционная группа, исследующая море Уэдделла в Антарктиде на борту ледокола «Поларштерн», попыталась укрыться от шторма, ученые и экипаж судна удивились внезапному появлению острова, не обозначенного ни на одной морской карте.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
