11.04.2025, 15:37

Мария Азарова

3,2 тыс

Ученые из «Яндекса», НИУ ВШЭ, MIT, KAUST и ISTA разработали прорывной метод сжатия больших языковых моделей

❋ 4.6

Теперь можно быстро тестировать нейросети и внедрять решения на основе их сжатых версий, экономя время и деньги. К примеру, «Яндекс» уже применяет метод HIGGS для ускоренного прототипирования.

Технологии

# нейросети

# языковые модели

# Яндекс

Лаборатория исследований ИИ Yandex Research вместе с коллегами из Национального исследовательского университета «Высшая школа экономики», Массачусетского технологического института, Научно-технологического университета имени короля Абдаллы в Саудовской Аравии и Австрийского института науки и технологий создала новый метод сжатия больших языковых моделей (LLM), чтобы работать с ними на привычных устройствах — смартфонах и ноутбуках. Причем за считаные минуты и с сохранением качества. Это открывает доступ к передовым ИИ-технологиям для небольших компаний, стартапов и независимых разработчиков, которые не могут позволить себе дорогие серверы и мощные графические процессоры.

Основная сложность в работе с LLM — их высокая требовательность к аппаратным мощностям. Даже открытые модели, такие как китайская DeepSeek-R1, не помещаются на стандартных серверах для машинного обучения и ИИ. Хотя модели в открытом доступе, их применение было ограничено.

Новый метод квантизации, получивший название HIGGS (Hadamard Incoherence with Gaussian MSE-optimal GridS), решает вышеописанную проблему: позволяет сжимать модели с сохранением качества и не требуя дополнительных данных. Теперь квантизацию, то есть операцию по сжатию модели, можно проводить на мобильном устройстве за минуты. Раньше на это уходило от нескольких часов до недель.

HIGGS протестировали на популярных языковых моделях Llama 3 и Qwen2.5. Согласно результатам, новый метод квантизации превзошел своих предшественников — NF4 и HQQ — по соотношению качества к размеру модели.

Исследование, в котором рассказано о достижении «Яндекса», НИУ ВШЭ, MIT, KAUST и ISTA, представят на конференции The North American Chapter of the Association for Computational Linguistics. Она пройдет с 29 апреля по 4 мая 2025 года в Альбукерке (США).

Статья уже опубликована на сервере препринтов arXiv.org, а сам метод HIGGS доступен на Hugging Face и GitHub.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Технологии

# нейросети

# языковые модели

# Яндекс

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Тайны земноводных: лягушка-голиаф, ядовитый древолаз и загадочный аксолотль

Российская государственная библиотека для молодежи

Москва

Экскурсия

04 Авг

Бесплатно

Все о звездных дождях

Космонавтика и авиация

Москва

Лекция

04 Авг

Бесплатно

Охота за Авророй: все о полярных сияниях

Астрокомплекс им. С.П. Королева

Москва

Лекция

05 Авг

Бесплатно

Тайны японского языка

Библиотека им. Анны Ахматовой

Москва

Московский зоопарк

Москва

Лекция

06 Авг

Бесплатно

Колористика: цветные картинки в печати и на экранах

Политехнический музей

Москва

Лекция

06 Авг

Бесплатно

Марковская республика

Библиотека им. Н. А. Некрасова

Москва

Лекция

06 Авг

Бесплатно

Человек начинается с незнания: как науки (не)создают нас

Sistema Gallery

Москва

Лекция

07 Авг

1000 ₽

Бессмертие по промокоду

Medio Modo

Москва

Вот это уже большой шаг к созданию настраиваемого под конкретного пользователя персонального ИИ-подсобника в телефоне (или карманного наставника по идеологической части- кому как угодно)

Ответить

Дождиков Антон

11.04.2025

Ответить

Ученые из «Яндекса», НИУ ВШЭ, MIT, KAUST и ISTA разработали прорывной метод сжатия больших языковых моделей

По теме

Ученый выявил «алгоритмическую шизофрению» нейросетей

Школа анализа данных «Яндекса» запустила программу подготовки ученых к использованию ИИ

Сергей Марков: сценарий «Терминатора» не грозит нам ни в близком, ни в далеком будущем

Популярное

Комментарии

Последние новости:

Конец стандартной Вселенной: почему космологи снова спорят о природе темной энергии

Древние охотники чаще добывали самок шерстистых мамонтов, чем самцов

Гляциологи впервые исследовали ледник на горе Арарат

Атомная бомбардировка Хиросимы создала неизвестный науке металлический сплав

Конец стандартной Вселенной: почему космологи снова спорят о природе темной энергии

Кризис без дефицита: почему Россия встала в очереди за бензином и когда они закончатся

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Климатический «щелчок»: может ли Эль-Ниньо изменить привычный нам мир

Последние комментарии

Самые обсуждаемые

Гляциологи впервые исследовали ледник на горе Арарат

Эксперт назвал ключевую технологию Starship тупиковой

Геологи нашли следы самой длинной эры пожаров в истории Земли

Внеземные цивилизации предложили искать по замедленному вращению звезд