• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
12.05.2021, 11:00
НИУ ВШЭ
887

В НИУ ВШЭ ускорили работу нейросети по распознаванию изображений

❋ 4.4

Профессор НИУ ВШЭ в Нижнем Новгороде Андрей Савченко разработал алгоритм, работающий на 40 процентов быстрее аналогов. При этом потери в точности составили не более 0,5-1 процентов. Это позволит ускорить работу систем видеонаблюдения в режиме реального времени.

В НИУ ВШЭ ускорили работу нейросети по распознаванию изображений / ©Getty imaeges / Автор: Telestis Scaevinius

Результаты исследования опубликованы в журнале Information Sciences. Для распознавания изображений используются сверточные нейронные сети, которые представляют собой последовательность слоев. В каждом слое есть вход и выход. На вход первого слоя поступает цифровое описание изображения, которое преобразуется в другой набор чисел на выход.

Новое описание поступает на вход следующего слоя и так далее, до тех пор, пока в последнем слое не будет предсказан класс объекта, изображенного на снимке: например, человек, кошка или стул. Для этого нейросеть обучается на изображениях, класс которых заранее известен. Чем больше различных изображений каждого класса в наборе данных, тем точнее будет работать обученная сеть.

Если примеров мало, используется так называемый алгоритм дообучения (fine-tuning) нейросети. Сеть предварительно обучается распознавать изображения из похожего большого набора данных, решающего исходную задачу. Например, при обучении распознаванию лиц или их атрибутов (эмоции, пол, возраст) сеть предварительно обучают идентифицировать знаменитостей по их фотографиям.

Затем полученная нейросеть дообучается распознавать изображения из доступного небольшого набора данных, например, идентифицировать лица членов семьи или родственников в домашних системах видеонаблюдения. Чем больше глубина (число) слоев в нейронной сети, тем точнее она работает, то есть правильнее предсказывает тип объекта на изображении. Но с увеличением числа слоев нейросеть распознает объекты дольше.

Автору исследования, профессору НИУ ВШЭ в Нижнем Новгороде Андрею Савченко удалось до 40 процентов ускорить работу дообученных глубоких сверточных нейросетей произвольного вида, состоящих из 90-780 слоев, при этом контролируя потери в точности — не более 0,5-1 процента. Ученый опирался на статистические методы последовательного анализа и множественных сравнений (множественной проверки гипотез).

«Решение в задаче распознавания изображений принимает классификатор — специальный математический алгоритм, который получает на вход массив чисел (характерные признаки изображения), а на выходе выдает предсказание о том, к какому классу относится изображенный объект. Классификатор можно применять, подавая ему на вход выходы любого слоя нейронной сети. Для распознавания «простых» изображений классификатору достаточно проанализировать данные (выходы) из первых слоев нейронной сети.

Не нужно дальше терять время, если мы уже уверены в надежности принятого решения. Для «сложных» картинок первых слоев явно недостаточно — нужно переходить к следующим. Поэтому в нейронную сеть были добавлены классификаторы на несколько промежуточных слоев. Они в зависимости от сложности входного изображения решали, продолжать распознавание или завершить. Так как в такой процедуре важно контролировать ошибки, я применил теорию  множественных сравнений: ввел много гипотез, на каком промежуточном слое остановиться, и последовательно проверял эти гипотезы», — объяснил Андрей Савченко.

Если уже первый классификатор выдавал решение, которое считалось процедурой множественной проверки гипотез надежным, алгоритм останавливался. Если же решение объявлялось не надежным, вычисления в нейросети продолжались до следующего промежуточного слоя, и проверка надежности повторялась.

Как отмечает ученый, наиболее точные решения получаются для выходов последних слоев нейронной сети. Выходы ранних слоев сети классифицируются намного быстрее, но чаще всего неточно. Поэтому необходимо все классификаторы одновременно обучить так, чтобы ускорить распознавание, при этом контролировать потерю в точности. Например, чтобы ошибка за счет более раннего останова оказывалась не более одного процента.

«Высокая точность важна всегда при распознавании изображений. Например, если решение в системах распознавания лиц принято неверно, то либо кто-то посторонний может получить доступ к конфиденциальной информации, либо наоборот пользователю будет многократно отказано в доступе, потому что нейросеть не смогла его правильно идентифицировать.

Скоростью иногда можно пожертвовать, но она имеет значение, например, в системах видеонаблюдения, где крайне желательно принимать решения в реальном времени, то есть не более 20-30 миллисекунд на один кадр. Чтобы распознать объект на видеокадре здесь и сейчас, очень важно действовать быстро, не теряя при этом точности», — подчеркнул профессор Савченко. 

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Национальный исследовательский университет «Высшая школа экономики» — один из крупнейших и самых востребованных вузов России. В университете учится 54 тысячи студентов и работает почти 4,5 тысячи учёных и преподавателей. НИУ ВШЭ ведёт фундаментальные и прикладные исследования в области социально-экономических, гуманитарных, юридических, инженерных, компьютерных, физико-математических наук, а также креативных индустрий. В университете действуют 47 центров превосходства, или международных лабораторий. Вышка объединяет ведущих мировых исследователей в области изучения мозга, нейротехнологий, биоинформатики и искусственного интеллекта. Университет входит в первую группу программы «Приоритет-2030» в направлении «Исследовательское лидерство». Кампусы НИУ ВШЭ расположены в четырех городах — Москве, Санкт-Петербурге, Нижнем Новгороде и Перми, а также в цифровом пространстве — «Вышка Онлайн».
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
10 декабря, 11:49
Игорь Байдов

Раскопки мастерской, погребенной в Помпеях почти 2000 лет назад, помогли археологам больше узнать о римских строительных технологиях, а именно — определить методы изготовления римского бетона и раскрыть секрет его долговечности.

10 декабря, 13:58
Андрей Серегин

Является ли моногамия естественным состоянием для человека? Новое исследование, основанное на анализе почти 200 тысяч родословных млекопитающих, подтвердило это суждение, поместив Homo sapiens в один эволюционный ряд с сурикатами и гиббонами.

10 декабря, 17:17
ФизТех

Коллектив исследователей из МФТИ и Института проблем передачи информации им. А. А. Харкевича (ИППИ РАН) разработал математическую модель, описывающую, как системы искусственного интеллекта влияют на собственное будущее, обучаясь на данных, которые сами же и породили. Ученые создали теоретический каркас, объясняющий природу «цифровых эхо-камер» и механизм, из-за которого умные алгоритмы со временем могут терять адекватность или усиливать социальные предрассудки.

8 декабря, 13:09
Александр Березин

С 2010-х в «Роскосмосе» говорили: будущая РОС сможет пролетать над полюсом, что даст ей возможности для новых научных экспериментов. Но вскоре после того, как в ноябре 2025 года Россия временно лишилась возможности запускать людей в космос, эта позиция изменилась. В результате запускать космонавтов с космодромов нашей страны станет довольно сложно.

9 декабря, 10:59
НИУ ВШЭ

Специфическая тревога из-за ненадежности цифровых образов реальности и иллюзии тотального контроля над действительностью получила название «аффект зомби». Заведующий кафедрой философии НИУ ВШЭ — Санкт-Петербург Иван Микиртумов исследовал феномен в рамках проекта РНФ «Экзистенциальный опыт в цифровой среде».

10 декабря, 11:49
Игорь Байдов

Раскопки мастерской, погребенной в Помпеях почти 2000 лет назад, помогли археологам больше узнать о римских строительных технологиях, а именно — определить методы изготовления римского бетона и раскрыть секрет его долговечности.

8 декабря, 13:09
Александр Березин

С 2010-х в «Роскосмосе» говорили: будущая РОС сможет пролетать над полюсом, что даст ей возможности для новых научных экспериментов. Но вскоре после того, как в ноябре 2025 года Россия временно лишилась возможности запускать людей в космос, эта позиция изменилась. В результате запускать космонавтов с космодромов нашей страны станет довольно сложно.

29 ноября, 12:42
Александр Березин

Позавчера, 27 ноября 2025 года, при запуске космонавтов к МКС на стартовую площадку № 31 упала кабина обслуживания стартового комплекса. Это означает, что новые пуски оттуда до починки невозможны. К сожалению, в 2010-х годах, в рамках «оптимизации» расходов, резервную площадку (с которой летал Юрий Гагарин) упразднили. Поэтому случилось беспрецедентное: в XXI веке страна с пилотируемой космической программой осталась без средств запуска людей на орбиту. Пока ремонт не закончится, проблема сохранится. Чем это может грозить?

27 ноября, 20:20
Максим Абдулаев

Японские биологи повторили античную технологию производства вина из изюма, чтобы выяснить механизм его брожения. Исследователи показали, что сушеный виноград, в отличие от свежего, накапливает на поверхности дикие дрожжи и способен превращать воду в алкоголь без внесения дополнительных заквасок.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно