26.12.2024

ФизТех

Новый метод квантования обеспечит стабильность бинарных нейронных сетей

❋ 4.4

Группа российских ученых из компании Smart Engines и МФТИ предложила новый способ квантования бинарных нейронных сетей. Им удалось добиться лучших результатов для обучения таких сетей.

ФизТех

# бинарные нейронные сети

# квантирование

# нейронные сети

# сверточные нейронные сети

Структура слоя БНС в режиме обучения / © Computer Optics 2024

Работа опубликована в журнале Computer Optics. Современные нейронные сети широко используются в самых разных областях: от обработки естественного языка и генерации изображений до распознавания символов на мобильных устройствах. В стремительно развивающемся мире искусственного интеллекта эффективность вычислений является критическим фактором. Для многих приложений, особенно для работы на маломощных устройствах (мобильные телефоны, встраиваемые системы, системы автономного вождения), критичны скорость и размер нейронной сети.

Бинарные нейронные сети (БНС)— это один из подходов к созданию компактных и быстрых сетей. В них веса и активации представляются всего одним битом информации (–1 или 1), что значительно уменьшает объем памяти, необходимый для хранения модели, и позволяет использовать быстрые побитовые операции вместо трудоемких умножений. Однако обучение БНС — сложная задача, которая долгое время сдерживала их широкое применение.

Традиционные методы обучения нейронных сетей не подходят для бинарных нейронных сетей. Основная сложность заключается в том, что функция активации (преобразование входных данных в бинарные значения) — это кусочно-постоянная функция (знаковая функция), которая имеет нулевую производную во всех точках, где эта производная определена, — затрудняет применение методов обратного распространения ошибки. Для решения этой проблемы использовались различные подходы.

Метод прямой оценки использует знаковую функцию при прямом проходе, а при обратном проходе — ее аппроксимацию для вычисления градиента. Недостатком является несоответствие градиентов и колебания весов, что приводит к медленному и нестабильному обучению.

Самобинаризующиеся нейронные сети используют гладкую аппроксимацию знаковой функции (например, гиперболический тангенс), которая постепенно приближается к знаковой функции по мере обучения. Недостатком является разрыв между обучаемой моделью и конечной бинарной моделью, что приводит к снижению точности.

Ученые из МФТИ с коллегами совершили прорыв, разработав новый метод квантования на неопределенной базе, который решает эту проблему, обеспечивая стабильное обучение и высокое качество бинарных нейронных сетей даже при ограниченном количестве параметров. Он сочетает в себе преимущества двух выше описанных методов.

Ключевой идеей квантования на основе неопределенности является использование вероятностной активации, которая учитывает неопределенность в значениях весов и активаций.

«В основе нашего метода UBQ лежит новая концепция неопределенности активаций, позволяющая получить более точную аппроксимацию бинарной функции и, как следствие, более эффективно обучать бинарные нейронные сети», — рассказал Антон Трусов, аспирант кафедры когнитивных технологий Физтех-школы прикладной математики и информатики МФТИ.

В квантовании на основе неопределенности для каждого веса и активации вычисляется значение неопределенности, отражающее, насколько сеть «уверена» в его знаке (+1 или –1). Если неопределенность высока, используется гладкая аппроксимация знаковой функции, обеспечивающая стабильное обучение.

Если неопределенность низка, применяется прямое оценивание, что способствует быстрому переходу к бинарному представлению. Кроме того, для сглаживания перехода от режима обучения к режиму исполнения авторы предлагают постепенное «замораживание» слоев сети и замену стандартной процедуры нормализации на ее упрощенный аналог.

Для проверки эффективности квантования на основе неопределенности были проведены эксперименты на широко используемых наборах данных MNIST (распознавание рукописных цифр) и CIFAR-10 (классификация изображений). Обучались несколько небольших и больших сверточных нейронных сетей с бинарными слоями, используя два описанных выше метода и новый авторский. Результаты сравнивались по точности классификации.

Эксперименты показали, что новый метод превосходит прежние при работе с небольшими сетями и демонстрирует сопоставимые результаты с методом прямой оценки для больших сетей. Кроме того, метод квантования на основе неопределенности продемонстрировал более стабильное обучение, чем метод прямой оценки, что подтверждается меньшим разбросом результатов в повторных экспериментах.

Метод квантования на основе неопределенности можно оптимизировать для различных задач и архитектур сетей. Дальнейшие исследования могут включать в себя адаптацию параметров метода для различных задач, использование динамической неопределенности весов, применение метода к другим типам квантованных сетей.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Московский физико-технический институт (национальный исследовательский университет), известен также как Физтех — ведущий российский вуз по подготовке специалистов в области теоретической, экспериментальной и прикладной физики, математики, информатики, химии, биологии и смежных дисциплин. Расположен в городе Долгопрудном Московской области, отдельные корпуса и факультеты находятся в Жуковском и в Москве.

ФизТех

# бинарные нейронные сети

# квантирование

# нейронные сети

# сверточные нейронные сети

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Болезнь Альцгеймера: новая парадигма диагностики и терапии

Парк «Зарядье»

Москва

Лекция

03 Июл

Бесплатно

Растения большого города

Центр «Архэ»

Москва

Лекция

03 Июл

Бесплатно

Применение ИИ в разработке лекарств

Библиотека Планетарий 1

Санкт-Петербург

Лекция

03 Июл

1300 ₽

Как астрономы помогают физикам

Живое слово

Тверь

Курилка Гутенберга

Москва

Лекция

03 Июл

Бесплатно

Исторические цивилизации на Северном Тянь-Шане

Русское географическое общество

Москва

Лекция

04 Июл

Бесплатно

Гипотезы о происхождении языка

ВДНХ

Москва

Лекция

05 Июл

Бесплатно

Диагноз по картине: болезни художников, повлиявшие на их творчество

ВДНХ

Москва

Лекция

05 Июл

Бесплатно

Власть Вечного города: как Древний Рим подчинил наше сознание?

ВДНХ

Москва

Популярное

За сутки

За неделю

За месяц

Сегодня, 11:17

Юлия Тарасова

Коров покормили отходами конопли и проверили их молоко на психоактивность

Результаты эксперимента в США в будущем могут позволить добиться разрешения на использование отработанной конопли в качестве кормовой добавки в животноводстве.

Биология

# животноводство

# конопля

# корм

# коровы

# молоко

# ТГК

# тетрагидроканнабинол

Сегодня, 15:35

Губкинский университет

В России создали технологию производства авиатоплива из растений

Исследования ученых РГУ нефти и газа имени И. М. Губкина подтвердили, что технология производства авиационного топлива SAF из растительных лигноцеллюлозных отходов позволит снизить выбросы углекислого газа на 75% по сравнению с нефтяным керосином.

Губкинский университет

# авиация

# биотопливо

# растения

# топливо

# углеродный след

Сегодня, 08:01

Адель Романова

Геологи объяснили «пульсацию» под земной корой в Африке

На стыке трех литосферных плит у Красного моря заметили необычный вулканический процесс: где-то магма поднимается равномерным потоком, где-то — по частям. По мнению геологов, такой «пульс» вызван тем, что в некоторых местах магма с большим трудом пытается пробиться на поверхность.

Геология

# Восточная Африка

# движение тектонических плит

# земная кора

# литосферные плиты

# мантийные плюмы

28 июня, 18:58

Игорь Байдов

Человек сделал балтийскую треску «карликом»

За последние 30 лет размер трески, обитающей в Балтийском море, значительно уменьшился. Если раньше рыбаки вылавливали из воды особей размером с маленького ребенка, то теперь добытая рыба легко помещается в ладонях. Авторы нового исследования винят в этом человека, который заставил один из видов эволюционировать в «карликов».

Биология

# Балтийское море

# Балтика

# виды

# промысел рыбы

# Рыба

# треска

# эволюция

27 июня, 09:47

Авдей Палиш

Биологи запустили стрим из «мегалогова» гремучих змей, чтобы восстановить их репутацию

Снимки с фотоловушек давно стали культурным явлением. Особенно забавными выглядят медведи. Мы с удовольствием смотрим на зверей, попавших в объектив камер в национальных парках: тигр украл фотоловушку, муравьед проехал верхом на муравьеде и так далее. Но не все животные настолько обаятельные. Ученые из США решили развить эмпатию к гремучим змеям, которых многие боятся. Для этого специалисты запустили трансляцию из «мегалогова», где рептилии отдыхают и рожают потомство.

Биология

# гремучая змея

# змеи

# камера

# сша

# трансляция

# фотоловушки

# эмпатия

29 июня, 17:23

Людмила Соколова

Астрономы впервые подсчитали количество пригодных для жизни экзопланет с помощью статистического метода

Чтобы понять, как часто за пределами Солнечной системы встречаются миры, похожие на Землю, ученые из Калифорнийского университета (США) провели статистический анализ 517 экзопланет. Результаты показали, что всего три мира, включая наш, соответствуют критериям потенциальной обитаемости. Наиболее перспективными из них оказались Kepler-22b и Kepler-538b.

Астрономия

# внеземная жизнь

# Джеймс Уэбб

# звезды

# обитаемые планеты

# статистика

# экзопланеты

17 июня, 16:49

Адель Романова

Давно отключенный спутник внезапно прислал «громкий» радиосигнал

Радиотелескопы уловили очень короткий сигнал, и по его характеристикам стало ясно, что он не может быть естественного происхождения. Астрономы пришли к выводу, что источник находился в околоземном пространстве — там, где уже более полувека летает «мертвый» аппарат NASA.

Астрономия

# космический мусор

# космос

# радиосигналы

# спутники

25 июня, 15:19

ФизТех

Российские ученые впервые точно определили источники шума сверхзвукового самолета с помощью суперкомпьютера

Группа российских ученых из Института прикладной математики имени М. В. Келдыша РАН и МФТИ провела детальное численное исследование источников шума, генерируемых крылом прототипа сверхзвукового бизнес-джета в режиме посадки. Эта работа, сочетающая передовые методы вычислительной гидродинамики и аэроакустики, впервые позволила с высокой точностью локализовать и охарактеризовать основные зоны шумообразования вблизи полноразмерной геометрии крыла модели прототипа сверхзвукового пассажирского самолета в посадочной конфигурации.

ФизТех

# «Суперджет»

# самолет

# сверхзвуковой

# суперкомпьютеры

# Шум

5 июня, 13:20

Александр Березин

Нашествие миллиона антилоп на Россию заставило фермеров просить об отстреле с вертолетов

Вид антилоп, с ледникового периода привыкший к массовым миграциям, пытается вернуться в свой исторический ареал, когда-то достигавший Днепра. Однако их нетипичные для травоядных привычки вызывают сильнейшее отторжение у сельских жителей, предлагающих массово уничтожать их с воздуха. С экологической точки зрения возвращение этих животных весьма желательно, но как примирить их с фермерами — неясно.

Биология

# антилопы

# глобальное озеленение

# Россия

[miniorange_social_login]

Новый метод квантования обеспечит стабильность бинарных нейронных сетей

По теме

В ЮФУ разработали алгоритм быстрого обнаружения малых целей с беспилотников

В Сколтехе квантовые компьютеры учат работать с «квантовыми данными»

Измерение магнитного поля Земли поможет прогнозировать стихийные бедствия

Популярное

Коров покормили отходами конопли и проверили их молоко на психоактивность

В России создали технологию производства авиатоплива из растений

Геологи объяснили «пульсацию» под земной корой в Африке

Человек сделал балтийскую треску «карликом»

Биологи запустили стрим из «мегалогова» гремучих змей, чтобы восстановить их репутацию

Астрономы впервые подсчитали количество пригодных для жизни экзопланет с помощью статистического метода

Давно отключенный спутник внезапно прислал «громкий» радиосигнал

Российские ученые впервые точно определили источники шума сверхзвукового самолета с помощью суперкомпьютера

Нашествие миллиона антилоп на Россию заставило фермеров просить об отстреле с вертолетов

Комментарии

Хотите
вести колонку
в нашем
издании?

Колумнисты 65

ПНИПУ

ФизТех

Сколтех

НИУ ВШЭ

ТюмГУ

РНФ

ЮФУ

МГППУ

НИТУ МИСИС

КНЦ РАН

Десять самых важных научных событий 2018 года

Безопасность превыше всего: как NASA планирует доставить первых людей на Марс?

Разбор: действительно ли тефлоновые покрытия вредны для здоровья и вызывают рак?

«Это фантастика!»: новый метод ускорения частиц работает

Новое лекарство от Covid-19 спасает тяжелобольных и вредит остальным (Upd. и Upd.2)

Самые странные объекты во Вселенной

Шестое массовое вымирание: реальность или «мусорная наука»?

Сокровища Акры: Naked Science побывал на раскопках «крымской Атлантиды»

Новый метод квантования обеспечит стабильность бинарных нейронных сетей

По теме

В ЮФУ разработали алгоритм быстрого обнаружения малых целей с беспилотников

В Сколтехе квантовые компьютеры учат работать с «квантовыми данными»

Измерение магнитного поля Земли поможет прогнозировать стихийные бедствия

Популярное

Комментарии

Хотите вести колонку в нашем издании?

Колумнисты 65

ПНИПУ

ФизТех

Сколтех

НИУ ВШЭ

ТюмГУ

РНФ

ЮФУ

МГППУ

НИТУ МИСИС

КНЦ РАН

Хотите
вести колонку
в нашем
издании?