Технологии искусственного интеллекта сегодня находят применение в самых разных сферах. В том числе в экологии и области охраны животных. Один из примеров — разработка ученых из МФТИ. Они предложили использовать нейросети для обработки данных, полученных с фотоловушек. Программа сортирует и обрабатывает до одного миллиона изображений в сутки, а ее точность — свыше 95%, при этом она быстрее ученого-эксперта на несколько порядков.
Выдра, сфотографированная с помощью фотоловушки / © Kalyan Varma, en.wikipedia.org
Исследование опубликовано в журнале Scientific and Technical Information Processing. Как объяснили ученые, фотоловушки — это устройства, которые фиксируют изображения животных и других объектов в их естественной среде. В России около несколько тысяч особо охраняемых природных территорий, где используют эти проборы.
«Обычно при обнаружении объекта устройство делает от одного до семи кадров. Проблема в том, что до 70% полученных фотографий неинформативны. Это происходит как по причине ложного срабатывания камеры (например, из-за движения веток или снега), так и неудачной позы животного. При этом обработка изображений вручную происходит крайне трудоемко. Чтобы оптимизировать задачу, группа разработала алгоритм, который сочетает два процесса: выявление и узнавание объектов и их последующую классификацию», — рассказал Владислав Ефремов, один из разработчиков, аспирант МФТИ Владислав Ефремов.
На первом этапе система анализирует изображения и устанавливает, содержат ли они животных. Для этой задачи исследователи протестировали несколько архитектур и выбрали нейронную сеть YOLOv5-L6. Эта модель адаптирована в том числе для таких условий, как низкая освещенность или перекрытие объекта другими предметами. При анализе тестовых данных точность этой программы составила 98,.5 %.
Следующий этап работы системы посвящен определению видовой принадлежности животных. Для этих целей исследователи задействовали сверточные нейронные сети. Этот алгоритм «изучает» изображение по маленьким фрагментам и выделяет ключевые детали — линии, углы и текстуры. Таким образом, сначала искусственный интеллект находит простые элементы (например, контуры), а затем собирает их в сложные (глаза, лапы, морды животных). Такие же нейросети, в частности, лежат в основе технологии распознавания лиц.
На этом этапе, по мнению исследователей, лидером стала архитектура ResNeSt-101. Она продемонстрировала точность классификации 98,.339 %. Помимо видов, программа также определяет подвиды животных.
«Для обучения нейронных сетей команда использовала более миллиона фотографий и 65 тысяч видеороликов, полученных с фотоловушек в различных заповедниках России. Эти данные были тщательно размечены, что позволило обучить модели с высокой точностью распознавать объекты и классифицировать их», — поделился Владислав Ефремов.
В настоящее время разработанная система способна обрабатывать до миллиона изображений в сутки. При этом точность распознавания достигает 95%, что сопоставимо с результатами, которые показывают эксперты-экологи. При этом программа выполняет работу быстрее на несколько порядков.
Как объяснили разработчики, предложенная нейросеть хорошо адаптируется под разные видовые составы и может быть задействована в любом из заповедников России. В будущем такие системы возьмут на себя большую часть рутинного труда экологов, позволяя им сосредоточиться на более важных задачах.
Дальнейшие перспективы исследования связаны с интеграцией фотоловушек и программного комплекса посредством систем спутниковой передачи данных. Также возможна разработка мобильных приложений для полевых исследований и создание «умных» фотоловушек со встроенными «мозгами» — нейросетевыми моделями, которые автоматически удаляют неудачные фото.