4 июня, 11:00

НИУ ВШЭ

Ученые упростили и ускорили дообучение нейросетей

❋ 4.4

Исследователи из ВШЭ и AIRI предложили метод быстрой донастройки нейросетей: данные обрабатываются по группам, которые затем перемешивают оптимальным образом, чтобы улучшить их взаимодействие. Метод лучше аналогов справляется с генерацией и анализом изображений, дообучением текстовых моделей. При этом он требует меньше памяти и времени на обучение.

НИУ ВШЭ

# данные

# Матрица

# нейросети

# обучение

Сравнение результатов генерации различными методами после 3000 шагов обучения / © Gorbunov, M., Yudin, N., Soboleva, V., Alanov, A., Naumov, A., Rakhuba, M. (2024). Group and shuffle: Efficient structured orthogonal parametrization. arXiv preprint

Результаты работы были представлены на конференции NeurIPS 2024. Чем больше нейросеть, тем сложнее быстро подстроить ее под новую задачу. Переобучать модель с нуля — это долго и дорого. Поэтому разработчики ищут бюджетные способы адаптировать ее под конкретную задачу, сохранив при этом общее качество исходной версии.

Один из них — донастройка с помощью ортогональных матриц: в отличие от альтернативных подходов, они сохраняют важные признаки исходной модели. Но у популярных вариантов вроде блочно-диагональных или бабочковых (Butterfly) матриц есть недостатки: они либо ограничены, либо требуют множества вычислений.

Исследователи факультета компьютерных наук НИУ ВШЭ и AIRI предложили новый способ построения матриц, который назвали «Группируй и перемешивай» (Group-and-Shuffle). Вместо того чтобы работать со всеми данными, они делят ее параметры на небольшие группы, обрабатывают каждую отдельно и перемешивают между собой. Такая структура оказалась одновременно гибкой и компактной: она помогает модели точнее подстраиваться под задачу, но при этом требует меньше вычислений и памяти.

На основе GS-матриц исследователи разработали метод GSOFT — новую реализацию ортогональной донастройки нейросетей. В отличие от предыдущих подходов, GSOFT использует меньше параметров, но сохраняет стабильность и качество обучения даже при малом объеме данных. Команда также предложила двусторонний вариант метода — Double GSOFT, который позволяет изменять параметры сразу с двух сторон, повышая гибкость и точность модели.

«Мы придумали, как формировать ортогональные матрицы, используя всего две матрицы специального вида, а не пять-шесть, как в прежних подходах. Это экономит ресурсы и время обучения», — объясняет Николай Юдин, стажер-исследователь Научно-учебной лаборатории матричных и тензорных методов в машинном обучении НИУ ВШЭ.

Исследователи протестировали подход на трех типах задач. В дообучении языковой модели RoBERTa метод работал лучше при сопоставимом числе параметров. В генерации изображений, где модель должна сохранять черты оригинала, но подстраиваться под запрос пользователя, GSOFT и Double GSOFT справились лучше популярных подходов вроде LoRA и BOFT, при этом они требуют меньше памяти и времени на обучение.

Авторы также протестировали свой подход на сверточных нейросетях, которые чаще всего используют для анализа изображений и видео — например, в распознавании лиц. Они адаптировали GS-матрицы даже для тех случаев, когда от модели требуется высокая устойчивость к помехам и искажениям.

«Мы проверили метод в различных сценариях — от языковых и генеративных моделей до устойчивых сверточных сетей. В каждом из них он работал надежно и при меньших затратах ресурсов. Это подтверждает, что мы можем использовать метод для разных целей», — комментирует старший научный сотрудник Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ, руководитель группы “Контролируемый генеративный ИИ” Лаборатории FusionBrain Института AIRI Айбек Аланов.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Национальный исследовательский университет «Высшая школа экономики» — один из крупнейших и самых востребованных вузов России. В университете учится 54 тысячи студентов и работает почти 4,5 тысячи учёных и преподавателей. НИУ ВШЭ ведёт фундаментальные и прикладные исследования в области социально-экономических, гуманитарных, юридических, инженерных, компьютерных, физико-математических наук, а также креативных индустрий. В университете действуют 47 центров превосходства, или международных лабораторий. Вышка объединяет ведущих мировых исследователей в области изучения мозга, нейротехнологий, биоинформатики и искусственного интеллекта. Университет входит в первую группу программы «Приоритет-2030» в направлении «Исследовательское лидерство». Кампусы НИУ ВШЭ расположены в четырех городах — Москве, Санкт-Петербурге, Нижнем Новгороде и Перми, а также в цифровом пространстве — «Вышка Онлайн».

НИУ ВШЭ

# данные

# Матрица

# нейросети

# обучение

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Полезная и вредная еда, как следить за рационом

Центр «Архэ»

Онлайн

Лекция

21 Окт

Бесплатно

Изучая формирование планет

Библиотека им. Н. А. Некрасова

Москва

Лекция

21 Окт

600 ₽

Когда лишайники колонизировали сушу и могут ли они помочь нам колонизировать Марс?

Центр «Архэ»

Санкт-Петербург

Русское географическое общество

Санкт-Петербург

Лекция

22 Окт

500 ₽

Метеороиды: от комет до метеорных дождей

Московский Планетарий

Москва

Лекция

22 Окт

900 ₽

Кто такие индейцы майя? Первые археологические свидетельства

Центр «Архэ»

Москва

Лекция

22 Окт

1000 ₽

Древняя магия глазами археолога

ВСмысле

Санкт-Петербург

Лекция

22 Окт

750 ₽

Не гормон счастья. Зачем нам серотонин?

Центр «Архэ»

Онлайн

Лекция

23 Окт

Бесплатно

Цифровая среда как новая вселенная человека

ИИМК РАН

Москва

Популярное

За сутки

За неделю

За месяц

19 октября, 10:00

Любовь С.

Ученые обновили официальный протокол на случай первого контакта

Первый официальный документ, описывающий принцип действий в случае возможного контакта с внеземной цивилизацией, был принят Международной академией астронавтики (IAA) в 1989 году. С тех пор декларацию неоднократно пересматривали, а ее обновленную версию, адаптированную под реалии XXI века, ученые разработали совместно с участниками проекта по поиску инопланетян SETI.

Астрономия

# Seti

# внеземная жизнь

# инопланетные цивилизации

# инопланетный разум

# радиоастрономия

# техносигнатуры

20 октября, 10:40

Юлия Трепалина

Психиатры описали необычный случай синдрома инкуба с сексуальными галлюцинациями

Индийские психиатры описали необычное психическое расстройство у мужчины с алкогольной зависимостью. Так называемый синдром инкуба, сопровождаемый сексуальными галлюцинациями, развился у пациента при попытке сократить потребление спиртного.

Психология

# алкоголизм

# галлюцинации

# психиатрия

# редкий случай

17 октября, 22:00

Любовь С.

Правило «подобное растворяется в подобном» не сработало на Титане

В густой оранжевой дымке Титана, где температура опускается до минус 180 градусов Цельсия, происходят невозможные по земным меркам химические реакции: молекула циановодорода (HCN), рожденная в атмосфере из азота, метана и этана, могла сформировать кристаллы, объединяющие вещества противоположной природы.

Астрономия

# атмосфера

# метан

# молекулы

# органические вещества

# Сатурн

# титан

# этан

17 октября, 22:00

Любовь С.

Правило «подобное растворяется в подобном» не сработало на Титане

Астрономия

# атмосфера

# метан

# молекулы

# органические вещества

# Сатурн

# титан

# этан

19 октября, 10:00

Любовь С.

Ученые обновили официальный протокол на случай первого контакта

Астрономия

# Seti

# внеземная жизнь

# инопланетные цивилизации

# инопланетный разум

# радиоастрономия

# техносигнатуры

18 октября, 11:06

Evgenia Vavilova

У мужчин с возрастом усиливается позитивный отбор спермы с вредными мутациями

Число несущих их клеток не просто увеличивается, механизм отбора связан с эволюционным преимуществом половых клеток. Узнать об этом помог улучшенный метод секвенирования ДНК.

Биология

# возрастные изменения

# секвенирование ДНК

# сперма

# сперматозоиды

# старение

# фертильность

13 октября, 11:10

Илья Гриднев

Движение жидкости в мозге предложили считать основой сознания

Согласно новой гипотезе, сознание возникает не только из-за активности нейронов, но и благодаря физическим процессам — электромагнитным полям от движения жидкости в мозге. Эта модель, как и ее предшественники, пока носит теоретический характер, но предлагает нестандартный взгляд на проблему синхронизации работы разных отделов мозга.

Биология

# мозг

# сознание

# электромагнитное поле

26 сентября, 11:41

ИИМК РАН

В Костенках обнаружили украшения и предметы, не имеющие аналогов в мире

Археологи Института истории материальной культуры РАН (ИИМК РАН), при поддержке фонда «История отечества» в ходе раскопок обнаружили на всемирно известной стоянке каменного века Костенки-17 в Воронежской области редчайшие украшения из зубов песца и окаменелой раковины, а также уникальный для этого времени нуклеус из бивня мамонта для снятия заготовок.

ИИМК РАН

# бивни

# клыки

# костенки

# мамонты

# украшения

7 октября, 11:46

Игорь Байдов

Анализ обломков «Эндьюранса» и дневников Шеклтона показал: исследователь заранее знал, что его судно не выдержит льдов

Экспедиционное судно «Эндьюранс» более века называли самым прочным деревянным судном, когда-либо построенным человеком. Но находка, сделанная на дне моря, и изучение старых писем раскрыли неприятную правду. Легендарный «Эндьюранс» Шеклтона вовсе не был непобедимым левиафаном. Напротив, он имел фатальные недостатки, а капитан знал об этом еще до того, как ушел в роковое плавание к берегам Антарктиды.

История

# антарктида

# судно

# Шеклтон

[miniorange_social_login]

Ученые упростили и ускорили дообучение нейросетей

По теме

В Перми приступили к разработке нового языка программирования

Ученые обнаружили предел полезности данных для обучения нейросетей

Российские ученые с помощью нейросети усовершенствовали технологию нейрообратной связи

Популярное

Ученые обновили официальный протокол на случай первого контакта

Психиатры описали необычный случай синдрома инкуба с сексуальными галлюцинациями

Правило «подобное растворяется в подобном» не сработало на Титане

Правило «подобное растворяется в подобном» не сработало на Титане

Ученые обновили официальный протокол на случай первого контакта

У мужчин с возрастом усиливается позитивный отбор спермы с вредными мутациями

Движение жидкости в мозге предложили считать основой сознания

В Костенках обнаружили украшения и предметы, не имеющие аналогов в мире

Анализ обломков «Эндьюранса» и дневников Шеклтона показал: исследователь заранее знал, что его судно не выдержит льдов

Комментарии

Хотите
вести колонку
в нашем
издании?

Колумнисты 65

ПНИПУ

ФизТех

Сколтех

НИУ ВШЭ

ТюмГУ

РНФ

ЮФУ

МГППУ

НИТУ МИСИС

КНЦ РАН

Деннис Медоуз: «Устойчивого развития достичь не удастся… И пора задуматься о том, как жить в фазе упадка, а не роста»

Это все биология! Хорошо ли вы ее знаете? Тест Naked Science

Глобальное потепление спасло треть миллиона британцев в XXI веке. Или даже больше?

Вредоносные программы: как защитить себя

Дрон, который смог. Где и как будут применять беспилотники

Кремний науки: как искусственный интеллект помогает педагогам и учащимся

CES 2016: «болтливые» кроссовки и платья с «крыльями»

Самые странные налоги в мире

Ученые упростили и ускорили дообучение нейросетей

По теме

В Перми приступили к разработке нового языка программирования

Ученые обнаружили предел полезности данных для обучения нейросетей

Российские ученые с помощью нейросети усовершенствовали технологию нейрообратной связи

Популярное

Комментарии

Хотите вести колонку в нашем издании?

Колумнисты 65

ПНИПУ

ФизТех

Сколтех

НИУ ВШЭ

ТюмГУ

РНФ

ЮФУ

МГППУ

НИТУ МИСИС

КНЦ РАН

Хотите
вести колонку
в нашем
издании?