• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
12.05.2021
НИУ ВШЭ
718

В НИУ ВШЭ ускорили работу нейросети по распознаванию изображений

4.4

Профессор НИУ ВШЭ в Нижнем Новгороде Андрей Савченко разработал алгоритм, работающий на 40 процентов быстрее аналогов. При этом потери в точности составили не более 0,5-1 процентов. Это позволит ускорить работу систем видеонаблюдения в режиме реального времени.

В НИУ ВШЭ ускорили работу нейросети по распознаванию изображений / ©Getty imaeges

Результаты исследования опубликованы в журнале Information Sciences. Для распознавания изображений используются сверточные нейронные сети, которые представляют собой последовательность слоев. В каждом слое есть вход и выход. На вход первого слоя поступает цифровое описание изображения, которое преобразуется в другой набор чисел на выход.

Новое описание поступает на вход следующего слоя и так далее, до тех пор, пока в последнем слое не будет предсказан класс объекта, изображенного на снимке: например, человек, кошка или стул. Для этого нейросеть обучается на изображениях, класс которых заранее известен. Чем больше различных изображений каждого класса в наборе данных, тем точнее будет работать обученная сеть.

Если примеров мало, используется так называемый алгоритм дообучения (fine-tuning) нейросети. Сеть предварительно обучается распознавать изображения из похожего большого набора данных, решающего исходную задачу. Например, при обучении распознаванию лиц или их атрибутов (эмоции, пол, возраст) сеть предварительно обучают идентифицировать знаменитостей по их фотографиям.

Затем полученная нейросеть дообучается распознавать изображения из доступного небольшого набора данных, например, идентифицировать лица членов семьи или родственников в домашних системах видеонаблюдения. Чем больше глубина (число) слоев в нейронной сети, тем точнее она работает, то есть правильнее предсказывает тип объекта на изображении. Но с увеличением числа слоев нейросеть распознает объекты дольше.

Автору исследования, профессору НИУ ВШЭ в Нижнем Новгороде Андрею Савченко удалось до 40 процентов ускорить работу дообученных глубоких сверточных нейросетей произвольного вида, состоящих из 90-780 слоев, при этом контролируя потери в точности — не более 0,5-1 процента. Ученый опирался на статистические методы последовательного анализа и множественных сравнений (множественной проверки гипотез).

«Решение в задаче распознавания изображений принимает классификатор — специальный математический алгоритм, который получает на вход массив чисел (характерные признаки изображения), а на выходе выдает предсказание о том, к какому классу относится изображенный объект. Классификатор можно применять, подавая ему на вход выходы любого слоя нейронной сети. Для распознавания «простых» изображений классификатору достаточно проанализировать данные (выходы) из первых слоев нейронной сети.

Не нужно дальше терять время, если мы уже уверены в надежности принятого решения. Для «сложных» картинок первых слоев явно недостаточно — нужно переходить к следующим. Поэтому в нейронную сеть были добавлены классификаторы на несколько промежуточных слоев. Они в зависимости от сложности входного изображения решали, продолжать распознавание или завершить. Так как в такой процедуре важно контролировать ошибки, я применил теорию  множественных сравнений: ввел много гипотез, на каком промежуточном слое остановиться, и последовательно проверял эти гипотезы», — объяснил Андрей Савченко.

Если уже первый классификатор выдавал решение, которое считалось процедурой множественной проверки гипотез надежным, алгоритм останавливался. Если же решение объявлялось не надежным, вычисления в нейросети продолжались до следующего промежуточного слоя, и проверка надежности повторялась.

Как отмечает ученый, наиболее точные решения получаются для выходов последних слоев нейронной сети. Выходы ранних слоев сети классифицируются намного быстрее, но чаще всего неточно. Поэтому необходимо все классификаторы одновременно обучить так, чтобы ускорить распознавание, при этом контролировать потерю в точности. Например, чтобы ошибка за счет более раннего останова оказывалась не более одного процента.

«Высокая точность важна всегда при распознавании изображений. Например, если решение в системах распознавания лиц принято неверно, то либо кто-то посторонний может получить доступ к конфиденциальной информации, либо наоборот пользователю будет многократно отказано в доступе, потому что нейросеть не смогла его правильно идентифицировать.

Скоростью иногда можно пожертвовать, но она имеет значение, например, в системах видеонаблюдения, где крайне желательно принимать решения в реальном времени, то есть не более 20-30 миллисекунд на один кадр. Чтобы распознать объект на видеокадре здесь и сейчас, очень важно действовать быстро, не теряя при этом точности», — подчеркнул профессор Савченко. 

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Национальный исследовательский университет «Высшая школа экономики» — одно из крупнейших и самых востребованных высших учебных заведений России, стран СНГ и государств Восточной Европы. В НИУ ВШЭ представлены все уровни образовательной подготовки (от лицея для школьников до аспирантуры и MBA) по широкому спектру направлений в области социально-экономических, гуманитарных, юридических, инженерных, компьютерных, физико-математических наук, а также творческих специальностей. Научные подразделения ВШЭ — институты, центры, лаборатории, возглавляемые ведущими российскими и зарубежными учеными, ориентированы как на фундаментальные исследования, так и на прикладные разработки по заказам федеральных и региональных органов власти, министерств и ведомств, российских и зарубежных компаний. Высшая школа экономики стабильно занимает высокие места в предметных рейтингах Times Higher Education (THE) и QS, а также является единственным российским университетом в топ-50 рейтингов молодых университетов сразу двух агентств.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
Вчера, 10:00
РНФ

Группа ученых из России и Германии математически описала ситуацию, когда происходит самоостановка света — явление, при котором скорость световых импульсов падает в миллионы раз, вплоть до нуля. Оказалось, что в определенных условиях излучение в резонансно поглощающей среде создает для себя «потенциальную яму», из которой затем не может выйти. Это происходит за счет обволакивания материей безмассовых фотонов, и в результате они могут остановиться.

Вчера, 16:09
Сергей Янкин

При помощи численного моделирования электромагнитных, механических и акустических процессов компания Tectonic Audio Labs создала современный динамик со сбалансированным излучателем (технология balanced mode radiator, или BMR). Динамик был использован в гарнитуре виртуальной реальности (VR) для корпорации Valve и теперь считается золотым стандартом для VR-аудио.

Позавчера, 10:02
Сергей Васильев

Распространяясь в популяциях крупных жвачных животных, паразиты незаметно оказывают мощное влияние на целые экосистемы, позволяя растительности спокойно развиваться и процветать.

20 мая
Мария Азарова

Ученые предупреждают: поскольку вес современных комбайнов и прочей сельхозтехники сегодня приближается к весу самых крупных животных, когда-либо бродивших по Земле, возникает парадокс уплотнения грунта.

Вчера, 10:00
РНФ

Группа ученых из России и Германии математически описала ситуацию, когда происходит самоостановка света — явление, при котором скорость световых импульсов падает в миллионы раз, вплоть до нуля. Оказалось, что в определенных условиях излучение в резонансно поглощающей среде создает для себя «потенциальную яму», из которой затем не может выйти. Это происходит за счет обволакивания материей безмассовых фотонов, и в результате они могут остановиться.

Позавчера, 10:02
Сергей Васильев

Распространяясь в популяциях крупных жвачных животных, паразиты незаметно оказывают мощное влияние на целые экосистемы, позволяя растительности спокойно развиваться и процветать.

26 апреля
Василий Парфенов

Крупнейшие патентные ведомства мира десятилетиями или веками принципиально игнорируют любые конструкции, нарушающие начала термодинамики. С точки зрения здравого смысла это хорошо, но конспирологи и гении-самоучки считают иначе. По их мнению, такая политика стала результатом заговора (подставьте сюда любое вымышленное или не очень секретное общество либо лобби). Что ж, похоже, Роспатент встал на их сторону.

27 апреля
Александра Медведева

С помощью GPS-трекинга ученые проследили за перемещениями целой популяции домашних кошек в небольшом норвежском городке. Оказалось, питомцы редко уходят от дома далее 50 метров и почти не совершают длительных прогулок.

28 апреля
Мария Азарова

Авторы нового исследования составили таблицу ожидаемой продолжительностью жизни для собак 18 чистокровных пород и метисов. Кроме того, они узнали, кто живет дольше — суки или кобели, кастрированные или нет.

[miniorange_social_login]

Комментарии

Написать комментарий

Подтвердить?
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: