• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
11 апреля
Мария Азарова
1
3 195

Ученые из «Яндекса», НИУ ВШЭ, MIT, KAUST и ISTA разработали прорывной метод сжатия больших языковых моделей

4.6

Теперь можно быстро тестировать нейросети и внедрять решения на основе их сжатых версий, экономя время и деньги. К примеру, «Яндекс» уже применяет метод HIGGS для ускоренного прототипирования.

Нейросети
© May James, Keystone Press Agency

Лаборатория исследований ИИ Yandex Research вместе с коллегами из Национального исследовательского университета «Высшая школа экономики», Массачусетского технологического института, Научно-технологического университета имени короля Абдаллы в Саудовской Аравии и Австрийского института науки и технологий создала новый метод сжатия больших языковых моделей (LLM), чтобы работать с ними на привычных устройствах — смартфонах и ноутбуках. Причем за считаные минуты и с сохранением качества. Это открывает доступ к передовым ИИ-технологиям для небольших компаний, стартапов и независимых разработчиков, которые не могут позволить себе дорогие серверы и мощные графические процессоры.

Основная сложность в работе с LLM — их высокая требовательность к аппаратным мощностям. Даже открытые модели, такие как китайская DeepSeek-R1, не помещаются на стандартных серверах для машинного обучения и ИИ. Хотя модели в открытом доступе, их применение было ограничено.

Новый метод квантизации, получивший название HIGGS (Hadamard Incoherence with Gaussian MSE-optimal GridS), решает вышеописанную проблему: позволяет сжимать модели с сохранением качества и не требуя дополнительных данных. Теперь квантизацию, то есть операцию по сжатию модели, можно проводить на мобильном устройстве за минуты. Раньше на это уходило от нескольких часов до недель.

HIGGS протестировали на популярных языковых моделях Llama 3 и Qwen2.5. Согласно результатам, новый метод квантизации превзошел своих предшественников — NF4 и HQQ — по соотношению качества к размеру модели.

Исследование, в котором рассказано о достижении «Яндекса», НИУ ВШЭ, MIT, KAUST и ISTA, представят на конференции The North American Chapter of the Association for Computational Linguistics. Она пройдет с 29 апреля по 4 мая 2025 года в Альбукерке (США).

Статья уже опубликована на сервере препринтов arXiv.org, а сам метод HIGGS доступен на Hugging Face и GitHub.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
2 часа назад
Андрей Папиш

Человечество много тысячелетий живет рядом с разными вредителями. Вездесущие тараканы, мыши, крысы, вши, комары, а также множество врагов сельского хозяйства. Особый научный интерес — выяснить, откуда эти спутники людей переселились и как давно с нами соседствуют. Энтомологи выяснили, что кровососущие постельные клопы живут с человеком более 10 тысяч лет, то есть, вероятно, дольше прочих насекомых-синантропов.

Вчера, 12:00
ПНИПУ

Яркие краски, стильные обои, практичный линолеум — все это может оказаться источником опасных токсинов, которые незаметно отравляют воздух в наших домах. Эксперты Пермского Политеха рассказали, почему пора прекратить строить дома и бани из железнодорожных шпал, что скрывает некачественный линолеум, почему асбестовый шифер вызывает рак, что не так с натяжными потолками, окнами и плинтусами, как правильно выбрать ламинат и обои для спальни?

Вчера, 11:41
ТюмГУ

Ученые ТюмГУ исследовали товарные формы полиакриламидов разных производителей с целью выбора оптимального реагента для повышения нефтеотдачи. Выяснилось, что использование метода пиролитической хроматографии позволяет надежно определять качественный состав и степень гидролиза и сульфонирования полиакриламидов.

Позавчера, 20:01
Юлия Трепалина

Американские исследователи создали плодовых мушек, способных пристраститься к кокаину. Генетически модифицированных насекомых планируют использовать для изучения основ кокаиновой зависимости у людей.

28 мая
Александр Березин

Третий раз подряд испытания второй модификации Starship вышли неудачными. Причем, в отличие от прошлых двух случаев, в этот раз не смогла отработать нормально даже первая ступень. Похоже, SpaceX не смогла корректно увидеть причины двух предшествующих частичных неудач, поэтому принятые меры по исправлению технических проблем не дали результатов.

29 мая
НИУ ВШЭ

Команда российских исследователей, включая ученых из НИУ ВШЭ, применили искусственный интеллект для анализа подписок 4,5 тысячи студентов на VK-сообщества. Оказалось, что алгоритмы могут с высокой точностью предсказывать, кто отличник, а у кого трудности с учебой.

6 мая
Редакция Naked Science

Да, с волосами и люком все так. У космонавта Суниты Уильямс волосы на МКС плавали свободно, а у Кэти Пэрри и прочих в полете 14 апреля 2025 года — нет. Но это не значит, что суборбитального космического полета первого чисто женского экипажа не было или что он был инсценировкой. Причем, в общем-то, чтобы понять это, даже не нужно обладать специальными знаниями.

22 мая
ПНИПУ

Недавно вышел второй сезон сериала «Одни из нас» (TheLastofUs), созданного по сюжету популярнейшей видеоигры. Ученые Пермского Политеха решили разобраться, насколько реален сценарий грибной пандемии, превращающей людей зомби? Чем живет кордицепс и как он «ищет» своих жертв, действительно ли паразит способен эволюционировать настолько, чтобы поражать человеческий организм и подчинять себе его волю, был бы у людей шанс выжить, какие грибы уже поселились в наших телах и выручит ли нас иммунитет, сформированный тысячелетиями.

6 мая
Александр Березин

Мощнейшее отключение электроэнергии за последние 20 лет истории Европы случилось уже неделю назад, а испанские власти пока так и не объявили о его причинах. Это логично: как мы покажем ниже, ответ на вопрос, кто виноват, получится очень неполиткорректным. И, более того, противоречащим линии правящей в Испании партии. Но мы живем за тысячи километров от нее, поэтому можем себе позволить аполитичный анализ случившегося. Так что же произошло на самом деле и каковы наши шансы увидеть подобное у себя дома?

[miniorange_social_login]

Комментарии

1 Комментарий
-
0
+
Вот это уже большой шаг к созданию настраиваемого под конкретного пользователя персонального ИИ-подсобника в телефоне (или карманного наставника по идеологической части- кому как угодно)
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно