В Пермском Политехе повысили точность нейросетей для распознавания изображений
Нейронные сети с каждым днем захватывают все больше различных сфер и автоматизируют множество процессов. Одно из популярных направлений — распознавание изображений. Его используют в медицинской диагностике, в автомобильной сфере для распознавания знаков на дороге, для навигации и визуального восприятия окружающей среды в робототехнике, для обнаружения инцидентов в системах видеонаблюдения. Требуется постоянная модификация и улучшение методов для снижения ошибок. Ученые ПНИПУ разработали подсистему машинного зрения, которая обеспечивает надежное распознавание мелких и разноудаленных от камеры объектов. Предложенная схема поможет, например, обнаружить оружие или опасные предметы в толпе.
Машинное зрение – это способность компьютеров «видеть» и понимать изображения так же, как это делают люди. С его помощью компьютер распознает лица на фотографиях и определяет типы объектов (например, машина, дерево, человек). Для решения задач обнаружения и идентификации используют нейронные сети. Но они могут выдавать ошибки, что отрицательно сказываются на точности всей системы.
У традиционной одноступенной схемы есть недостатки – игнорирование контекста при поиске объектов и отсутствие жесткой привязки размеров объекта на изображении к параметрам перспективы сцены (кадра). Из-за этого увеличивается количество неверных результатов. Также нейросетевая модель, обученная на универсальном наборе категорий, может неправильно распознавать объекты, если происходит изменение качества или ракурса изображения.
Ученые Пермского Политеха разработали подсистему машинного зрения, которая обеспечивает высокую точность классификации и сегментации. Классификация позволяет определить, к какой категории относится объект, а сегментация – выделить и обозначить его контуры. Политехники предложили двухступенную (двухэтапную) схему обработки изображений независимыми нейронными сетями. Она учитывает контекст сцены и адаптируется к степени удаленности объектов или изменению ракурса съемки.
Основной принцип разработанной политехниками схемы – разделение классов на «суперобъекты» и «вложенные объекты». На первом этапе нейросеть ищет и выделяет область интереса: остается только ограничивающий прямоугольник с суперобъектом («оружие» у «человека», «деталь» — часть «станка»), все остальное обрезается. Таким образом гарантируется, что искомый объект будет находиться внутри области интереса. На втором этапе происходит обнаружение и сегментация искомых объектов.
Такой подход, например, подходит для системы видеонаблюдения с возможностью обнаружения оружия и опасных предметов в толпе, когда люди находятся на разном расстоянии от камер. Обычная нейронная сеть может не различить носимое оружие на очень удаленных или очень приближенных позициях сцены. Но, если предварительно обнаружить силуэты всех людей на снимке, то детекция (распознавание) оружия будет более точной. Другие примеры – идентификация различных разноудаленных конструкций, механизмов со множеством деталей, аэрофотосъемка.
«Мы разработали новую схему обработки изображений с помощью нейронных сетей. Она находит объекты искомых категорий вне зависимости от их размеров, а также стабильна к изменению условий съемки. Увеличение точности на 25 процентов на отдельных тестовых изображениях происходит за счет искусственного ограничения назначения категорий и локализации объектов в контексте сцены обрабатываемого изображения», – поделился кандидат технических наук, доцент кафедры автоматики и телемеханики ПНИПУ Андрей Кокоулин.
Разработка ученых Пермского Политеха улучшит распознавание изображений с помощью нейросетей, повысит точность определения мелких и разноудаленных от камеры объектов. Предложенная схема поможет, например, обнаружить оружие или опасные предметы в толпе.
В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.
Последние несколько лет по всему миру выходит множество работ о том, что микрочастицы искусственных полимеров накапливаются в тканях человека и могут быть небезопасны. Мы решили обратиться к академику Алексею Хохлову, чтобы дать трибуну противоположной точке зрения. Выбор между ними предлагаем сделать читателю.
Ученые раскрыли причины удивительной сохранности крупнейшей из пирамид Гизы. Секрет того, что за прошедшие тысячелетия пирамиду не разрушили землетрясения, кроется в особенностях ее конструкции, в том числе в так называемых разгрузочных камерах, расположенных непосредственно над погребальной камерой фараона.
В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.
Астрофизики Южного федерального университета предложили объяснение одной из самых интригующих загадок современной физики — годичных колебаний сигнала в детекторе DAMA/LIBRA, который вот уже почти тридцать лет регистрирует странные сигналы в подземной лаборатории Гран-Сассо в Италии, интерпретируемые как взаимодействие частиц темной материи с обычным веществом.
Последние несколько лет по всему миру выходит множество работ о том, что микрочастицы искусственных полимеров накапливаются в тканях человека и могут быть небезопасны. Мы решили обратиться к академику Алексею Хохлову, чтобы дать трибуну противоположной точке зрения. Выбор между ними предлагаем сделать читателю.
В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.
Релиз довольно неожиданно перенес время образования протонов и нейтронов в более раннее прошлое Вселенной. К сожалению, из его текста осталось неясным научное обоснование таких фундаментальных изменений в космологии. Также он резко передвинул в прошлое и момент возникновения реликтового излучения.
При совпадении нескольких условий наши глаза способны улавливать излучение в ближнем инфракрасном спектре. Тогда сетчатка начинает работать как нелинейный фотодетектор.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно