17 февраля, 10:59

НИУ ВШЭ

Как уместить языковую модель в меньшую память: метод ProcrustesGPT

❋ 4.8

Исследователи из Института искусственного интеллекта и цифровых наук (Институт ИИиЦН) ФКН НИУ ВШЭ разработали новый метод сжатия больших языковых моделей, таких как GPT и LLaMA, который позволяет уменьшить их объем на 25–36% без дополнительного обучения и значительной потери в точности. Это первый подход, который использует математические преобразования — вращения весов модели, — чтобы сделать модели более удобными для сжатия с помощью структурированных матриц.

НИУ ВШЭ

# большие языковые модели

# искусственный интеллект

# память

# технологии

Большие языковые модели, такие как ChatGPT и LLaMA, показывают впечатляющие результаты в генерации текста, переводе и других задачах, но их огромный размер делает их дорогими в использовании и хранении. Традиционные методы сжатия — уменьшение точности чисел, удаление лишних связей или упрощение структуры — часто требуют долгого дообучения модели и могут ухудшить ее работу. Ученые искали способ сократить объем модели быстро и без потери ее интеллекта.

Исследователи НУЛ матричных и тензорных методов в машинном обучении Института ИИиЦН предложили метод ProcrustesGPT, основанный на идее, что выходные данные модели не меняются, если применить к ее внутренним весам специальные ортогональные преобразования — своего рода математические повороты. Как объясняют ученые, это такое преобразование пространства, которое может как угодно повернуть или перевернуть картинку, но не может растянуть или сжать ни один объект. Например, если взять лист бумаги с нарисованным на нем треугольником, то можно перевернуть или повернуть его под любым углом — длины сторон и углы между ними останутся точно такими же. В математике такое преобразование и называется ортогональным. Эти преобразования подбираются так, чтобы веса модели лучше поддавались сжатию с помощью структурированных матриц — математических конструкций, которые занимают гораздо меньше памяти. Результаты исследования опубликованы в ACL Findings 2025. Код метода доступен на GitHub.

Екатерина Гришина, стажер-исследователь НУЛ матричных и тензорных методов в машинном обучении, объясняет: «В основе нашей работы лежит изящная математическая концепция — задача Прокруста. Как и мифический герой, подгонявший путников под свое ложе, этот метод помогает найти идеальное ортогональное преобразование, которое подгоняет веса модели под простую структуру без искажения ее сути. Именно эта идея дала имя нашему методу — ProcrustesGPT — и стала ключом к сжатию без значительной потери качества».

В рамках работы были опробованы два типа таких структур: суммы кронекеровских произведений и GS-матрицы. Метод не требует дообучения модели, работает быстро и может применяться к уже существующим моделям. Эксперименты проводились на открытых моделях OPT и LLaMA2.

Новый метод ProcrustesGPT демонстрирует эффективность: он позволяет уменьшить объем больших языковых моделей на треть, а точнее, на 25–36% от исходного размера, сохранив при этом их интеллектуальные способности. Сжатые модели показывают результаты, близкие к оригиналам: на генерации связного текста и решении логических задач они сохраняют от 90 до 95% своей первоначальной эффективности.

В сравнении с другими современными методами сжатия, например SliceGPT, который также не требует длительного дообучения, ProcrustesGPT в большинстве тестов оказался точнее. Особенно ярко это преимущество проявляется при работе с моделями семейства LLaMA2, на которых разработанный подход опережает аналог на 9–10%.

Максим Рахуба, заведующий НУЛ матричных и тензорных методов в машинном обучении Института ИИиЦН НИУ ВШЭ, рассказывает: «Методы сжатия помогают ускорять внедрение больших языковых моделей в устройства с ограниченными ресурсами, такие как мобильные устройства и IoT-гаджеты, что делает ИИ более доступным и распространенным в повседневной жизни».

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Национальный исследовательский университет «Высшая школа экономики» — один из крупнейших и самых востребованных вузов России. В университете учится 54 тысячи студентов и работает почти 4,5 тысячи учёных и преподавателей. НИУ ВШЭ ведёт фундаментальные и прикладные исследования в области социально-экономических, гуманитарных, юридических, инженерных, компьютерных, физико-математических наук, а также креативных индустрий. В университете действуют 47 центров превосходства, или международных лабораторий. Вышка объединяет ведущих мировых исследователей в области изучения мозга, нейротехнологий, биоинформатики и искусственного интеллекта. Университет входит в первую группу программы «Приоритет-2030» в направлении «Исследовательское лидерство». Кампусы НИУ ВШЭ расположены в четырех городах — Москве, Санкт-Петербурге, Нижнем Новгороде и Перми, а также в цифровом пространстве — «Вышка Онлайн».

НИУ ВШЭ

# большие языковые модели

# искусственный интеллект

# память

# технологии

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Грызуны и зайцеобразные: секрет эволюционного успеха

Центр «Архэ»

Москва

Центр «Архэ»

Онлайн

Лекция

17 Фев

Бесплатно

Космические орбиты Китая

Космонавтика и авиация

Москва

Лекция

18 Фев

1000 ₽

Выход на сушу: кто такие высшие растения (Embryophyta) и от кого они произошли?

Центр «Архэ»

Москва

Лекция

18 Фев

Бесплатно

Биологический возраст: как универсально измерить здоровье?

Сколтех

Москва

Лекция

19 Фев

Бесплатно

Из истории здания Зоологического музея на Стрелке Васильевского острова

Зоологический музей РАН

Санкт-Петербург

Экскурсия

20 Фев

Бесплатно

Лампы, кнопки, два пульта

Космонавтика и авиация

Москва

Лекция

20 Фев

Бесплатно

Растения, способные удивлять: то, чего вы не знали о ботанике

СПбГУ

Санкт-Петербург

Лекция

20 Фев

Бесплатно

Сад за полярным кругом: фантастика или реальность

Русское географическое общество

Москва

Популярное

За сутки

За неделю

За месяц

16 февраля, 12:35

Илья Гриднев

Ученые предложили столкнуть три теории сознания в эксперименте со слепым пятном глаза

Нейробиологи разработали строгий экспериментальный протокол, чтобы выяснить, как мозг конструирует картину мира в области слепого пятна сетчатки. Это поможет формально проверить и сравнить предсказания трех популярных теорий сознания.

Биология

# зрение

# слепое пятно

# теория сознания

16 февраля, 09:00

ПНИПУ

Археологи датировали и установили назначение древнего уральского городища

Городище Пармайлово I на Урале долгие годы оставалось загадкой для исследователей. Из-за отсутствия раскопок его причисляли то к древним захоронениям, то к средневековым поселениям, а предполагаемый возраст памятника колебался в диапазоне нескольких столетий. Впервые разрешить противоречия помогли артефакты, обнаруженные в ходе раскопок учеными Пермского Политеха и ПГГПУ. Они нашли предметы, которые позволили точно датировать объект и определить его культурную принадлежность и место в истории России.

ПНИПУ

# артефакты

# археологические раскопки

# археология

# городище

# история

# Урал

16 февраля, 07:00

Максим Абдулаев

Потепление не увеличило, а уменьшило ареалы пшеницы и ячменя

Археологи из Дании и Испании восстановили карту растительности Ближнего Востока времен зарождения сельского хозяйства. Вопреки популярному мнению, потепление климата не расширило, а сократило ареалы диких злаков на 25%, вынудив древних людей начать их культивацию в изолированных экологических убежищах.

Археология

# «плодородный полумесяц»

# земледелие

# злаки

12 февраля, 07:52

Адель Романова

В архивах NASA нашли записи о падении на Землю двух неизвестных межзвездных объектов

Астрономы недавно проанализировали базу данных о падающих на Землю объектах и пришли к выводу, что два из них прибыли из межзвездного пространства. Известна не только дата, но и место падения каждого из них.

Астрономия

# космос

# межзвездные объекты

# метеороиды

# падение метеорита

12 февраля, 11:41

Александр Березин

Посадки деревьев для борьбы с углекислым газом усилили выбросы углекислого газа

На наземные растения, в основном деревья, приходится 80 процентов всей биомассы Земли, 450 миллиардов тонн сухого углерода и более двух триллионов тонн «живого веса». Поэтому идея сажать новые леса для связывания СО2 из атмосферы долго казалась логичной. Новые данные показали, что реальность заметно сложнее.

Биология

# антропогенные выбросы углекислого газа

# глобальное потепление

# деревья

12 февраля, 08:19

Полина Меньшова

Психологи выяснили, сколько раз за жизнь люди способны сильно влюбиться

«Любить лишь можно только раз», — писал поэт Сергей Есенин, а герои культовых сериалов приходили к выводу, что «настоящая» влюбленность случается в жизни максимум дважды. Однако ни один из этих тезисов не подкреплен научными данными. Американские исследователи подошли к вопросу иначе: опросили более 10 тысяч человек и вывели среднее число сильных влюбленностей, возможных в течение жизни.

Психология

# влюбленность

# любовь

# романтические отношения

# страсть

12 февраля, 07:52

Адель Романова

В архивах NASA нашли записи о падении на Землю двух неизвестных межзвездных объектов

Астрономия

# космос

# межзвездные объекты

# метеороиды

# падение метеорита

28 января, 10:50

Игорь Байдов

В Мексике нашли небольшого динозавра, решавшего споры лбом

Международная команда палеонтологов описала новый вид динозавра размером с крупную современную птицу. Он носил на голове плотный костяной нарост, который эти животные, возможно, использовали для внутривидовых разборок. Находка показывает, что даже мелкие хищники мелового периода могли решать конфликты не только когтями и зубами, но и ударами головой.

Палеонтология

# динозавры

# древние виды

# древние животные

# меловой период

26 января, 14:26

Александр Березин

Анализ лунного грунта опроверг космическое происхождение земной воды

Образцы грунта, взятые астронавтами полвека назад, вложили еще один важный кирпич в здание научной картины мира: гипотеза о том, что Земля исходно была сухой, не стыкуется с фактами. Похоже, идею о невозможности сохранения большого количества воды на «теплых» планетах придется пересмотреть.

Астрономия

# внеземная вода

# Земля

# Луна

[miniorange_social_login]

Как уместить языковую модель в меньшую память: метод ProcrustesGPT

По теме

Новый подход к обучению языковых моделей снизил затраты памяти без потери качества

Ученые выяснили, как неизбежные дефекты влияют на работу сверхпроводниковых нейронов

Нейросеть создает песни Nirvana, Эми Уайнхаус и других музыкантов. Проект помогает артистам с психологическими проблемами

Популярное

Ученые предложили столкнуть три теории сознания в эксперименте со слепым пятном глаза

Археологи датировали и установили назначение древнего уральского городища

Потепление не увеличило, а уменьшило ареалы пшеницы и ячменя

В архивах NASA нашли записи о падении на Землю двух неизвестных межзвездных объектов

Посадки деревьев для борьбы с углекислым газом усилили выбросы углекислого газа

Психологи выяснили, сколько раз за жизнь люди способны сильно влюбиться

В архивах NASA нашли записи о падении на Землю двух неизвестных межзвездных объектов

В Мексике нашли небольшого динозавра, решавшего споры лбом

Анализ лунного грунта опроверг космическое происхождение земной воды

Комментарии

Хотите
вести колонку
в нашем
издании?

Колумнисты 66

ПНИПУ

ФизТех

НИУ ВШЭ

Сколтех

ТюмГУ

РНФ

ЮФУ

МГППУ

РТУ МИРЭА

НИТУ МИСИС

Лицо государства: что означают символы на гербах?

Призраки Марса: самые странные предметы на снимках планеты

Живем ли мы в одноэлектронной Вселенной: гид по одной из самых экзотических гипотез

Догнать «ракетного короля»: топ конкурентов Маска

Крейсер для орбиты: чем можно вооружить космические корабли

Увядание крупнейшего зеленого эксперимента, или Как органическое земледелие всего за два года довело Шри-Ланку до дефолта

Кому война, кому — психиатр: боевая психическая травма и как с ней выжить

10 способов повысить когнитивные способности

Как уместить языковую модель в меньшую память: метод ProcrustesGPT

По теме

Новый подход к обучению языковых моделей снизил затраты памяти без потери качества

Ученые выяснили, как неизбежные дефекты влияют на работу сверхпроводниковых нейронов

Нейросеть создает песни Nirvana, Эми Уайнхаус и других музыкантов. Проект помогает артистам с психологическими проблемами

Популярное

Комментарии

Хотите вести колонку в нашем издании?

Колумнисты 66

ПНИПУ

ФизТех

НИУ ВШЭ

Сколтех

ТюмГУ

РНФ

ЮФУ

МГППУ

РТУ МИРЭА

НИТУ МИСИС

Хотите
вести колонку
в нашем
издании?