11.04.2025, 15:37

Мария Азарова

3,2 тыс

Ученые из «Яндекса», НИУ ВШЭ, MIT, KAUST и ISTA разработали прорывной метод сжатия больших языковых моделей

❋ 4.6

Теперь можно быстро тестировать нейросети и внедрять решения на основе их сжатых версий, экономя время и деньги. К примеру, «Яндекс» уже применяет метод HIGGS для ускоренного прототипирования.

Технологии

# нейросети

# языковые модели

# Яндекс

Лаборатория исследований ИИ Yandex Research вместе с коллегами из Национального исследовательского университета «Высшая школа экономики», Массачусетского технологического института, Научно-технологического университета имени короля Абдаллы в Саудовской Аравии и Австрийского института науки и технологий создала новый метод сжатия больших языковых моделей (LLM), чтобы работать с ними на привычных устройствах — смартфонах и ноутбуках. Причем за считаные минуты и с сохранением качества. Это открывает доступ к передовым ИИ-технологиям для небольших компаний, стартапов и независимых разработчиков, которые не могут позволить себе дорогие серверы и мощные графические процессоры.

Основная сложность в работе с LLM — их высокая требовательность к аппаратным мощностям. Даже открытые модели, такие как китайская DeepSeek-R1, не помещаются на стандартных серверах для машинного обучения и ИИ. Хотя модели в открытом доступе, их применение было ограничено.

Новый метод квантизации, получивший название HIGGS (Hadamard Incoherence with Gaussian MSE-optimal GridS), решает вышеописанную проблему: позволяет сжимать модели с сохранением качества и не требуя дополнительных данных. Теперь квантизацию, то есть операцию по сжатию модели, можно проводить на мобильном устройстве за минуты. Раньше на это уходило от нескольких часов до недель.

HIGGS протестировали на популярных языковых моделях Llama 3 и Qwen2.5. Согласно результатам, новый метод квантизации превзошел своих предшественников — NF4 и HQQ — по соотношению качества к размеру модели.

Исследование, в котором рассказано о достижении «Яндекса», НИУ ВШЭ, MIT, KAUST и ISTA, представят на конференции The North American Chapter of the Association for Computational Linguistics. Она пройдет с 29 апреля по 4 мая 2025 года в Альбукерке (США).

Статья уже опубликована на сервере препринтов arXiv.org, а сам метод HIGGS доступен на Hugging Face и GitHub.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Технологии

# нейросети

# языковые модели

# Яндекс

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Бобры. Все о речных строителях

Российская государственная библиотека для молодежи

Москва

Лекция

28 Июл

Бесплатно

О строении Земли и земного ядра

Русское географическое общество

Москва

Лекция

28 Июл

Бесплатно

Тайна «Маленьких Красных Точек»: что скрывает ранняя Вселенная?

Астрокомплекс им. С.П. Королева

Москва

Лекция

29 Июл

Бесплатно

Как строят метро в Петербурге

Библиотека Планетарий 1

Санкт-Петербург

Лекция

29 Июл

Бесплатно

«Отцы и дети» И. Тургенева: не война поколений, а тест на гибкость

ВДНХ

Москва

Лекция

29 Июл

1000 ₽

В скольких измерениях мы живем?

ВСмысле

Санкт-Петербург

Лекция

29 Июл

2000 ₽

Что мы можем и не можем увидеть на звездном небе

Московский Планетарий

Москва

Лекция

30 Июл

Бесплатно

Превентивная медицина, биохакинг и спорт

Курилка Гутенберга

Москва

Москва

Популярное

За сутки

За неделю

За месяц

28 июля, 10:09

ПНИПУ

Российские ученые создали модель, которая прогнозирует продолжительность жизни населения с точностью 99,7%

Рост средней продолжительности жизни и старение населения формируют новые требования к системе государственного планирования. Для обоснованного распределения ресурсов в сфере здравоохранения, пенсионного обеспечения и социальной поддержки необходимы достоверные данные о возрастной структуре общества. Сегодня для этого применяют специальные математические модели, позволяющие прогнозировать изменения. Проблема в том, что их создавали еще в прошлом веке. Они не учитывают существующие демографические закономерности и улучшение качества современной жизни. Их использование часто ведет к значительным погрешностям в расчетах, что, в свою очередь, делает невозможным своевременное перераспределение бюджетных средств между ключевыми государственными структурами. Ученые Пермского Политеха предложили новую модель для прогнозирования продолжительности жизни, которая работает с точностью 99,7%. Ее можно применять для планирования в сфере здравоохранения, пенсионного обеспечения и социальной поддержки.

ПНИПУ

# демография

# моделирование

# население

# прогнозирование

# продолжительность жизни

28 июля, 13:27

Александр Березин

Эксперт назвал ключевую технологию Starship тупиковой

Бывшие сотрудники NASA констатировали, что последнее видео испытаний крупнейшего космического корабля в истории снова показало проблемы и ограничения его теплового щита. С их точки зрения, любая из существующих технологий такого типа слишком сложна для реализации замысла Илона Маска о быстрой и безремонтной многоразовости Starship.

Космонавтика

# SpaceX

# StarShip

# космонавтика

28 июля, 07:01

Мария Азарова

Массовые расстрелы и самоубийства достигли пика в одно и то же время года

Пик массовых расстрелов и смертей в результате суицида приходится на одно и то же время года. К такому выводу пришли медики, проанализировав данные о тысячах подобных трагедий в США за восемь лет.

Психология

# преступления

# расстрелы

# самоубийства

# скулшутинг

# суицид

# суицидальное поведение

24 июля, 11:13

Игорь Байдов

Звуки помогли повысить урожайность

Правильно подобранные звуковые последовательности способны не только стимулировать рост растений, но и влиять на их урожайность. К такому выводу пришли авторы нового исследования. Они разработали технологию, которая позволяет воздействовать на процессы развития растений через акустические сигналы без использования генной инженерии или химикатов. В экспериментах добились повышения урожайности мяты, сои, болгарского перца и конопли.

Биология

# ботаника

# звуки

# каннабис

# конопля

# растения

# урожайность

25 июля, 10:46

Александр Березин

Starship впервые в истории вывел в космос полезную нагрузку — чтобы сразу сжечь ее в атмосфере

Формально почти вся программа тринадцатого полета самой большой ракеты в истории выполнена. Однако испытания показали неполную отлаженность ключевого элемента системы. SpaceX оказывается в ситуации действительно плотных сроков: до намеченного возвращения людей на Луну всего два года и два месяца.

Космонавтика

# SpaceX

# StarShip

# космос

# лунная гонка

# США

24 июля, 12:05

Андрей Серегин

Лингвисты выяснили, что три тысячи лет назад в мире было в 10 раз больше языков

Сегодня на земле существует примерно 7500 языков, однако ученые давно подозревали, что в прошлом их было значительно больше. Международная группа лингвистов реконструировала историю языкового разнообразия за последние 12 тысяч лет и пришла к выводу, что человечество уже пережило «золотой век» языков, после которого их число начало быстро сокращаться.

Антропология

# голоцен

# колонизация

# культура

# лингвистика

# языки

9 июля, 13:06

Редакция Naked Science

YouTube в России вырос даже с ограничениями, в отличие от «VK Видео»

Видеосервисы стали неотъемлемой частью жизни россиян. В 2026 году охваты большинства платформ продолжают расти, в том числе YouTube.

Медиа

# «ВКонтакте»

# YouTube

# аудитория

# блокировки

# видеосервис

# интернет

# медиа

1 июля, 11:54

Марк Чернов

Историки объяснили, как римляне строили идеально прямые дороги на тысячи километров

Древнеримские инженеры проложили колоссальную сеть дорог через Европу, Северную Африку и Ближний Восток, многие участки которой до сих пор поражают безупречной прямолинейностью. Секрет строительства заключался в использовании трех особых геодезических инструментов, с помощью которых разбивали местность на ровные отрезки и размечали трассы.

История

# Древний Рим

# инженерия

# инструменты

# история

# Римская империя

19 июля, 20:09

Александр Березин

Кризис без дефицита: почему Россия встала в очереди за бензином и когда они закончатся

Очереди на заправках стали привычным явлением в России, а на фоне информационного вакуума от властей о конкретных показателях производства бензина в июне население вынуждено ориентироваться на слухи. Все это выглядит довольно странно, но есть нюанс: скорее всего, кризис уже начинает выдыхаться. Как именно мы это выяснили?

С точки зрения науки

# бензин

# нпз

# Россия

# экономика

Выбор редакции

[miniorange_social_login]

Вот это уже большой шаг к созданию настраиваемого под конкретного пользователя персонального ИИ-подсобника в телефоне (или карманного наставника по идеологической части- кому как угодно)

Ответить

Дождиков Антон

11.04.2025

Ответить

Ученые из «Яндекса», НИУ ВШЭ, MIT, KAUST и ISTA разработали прорывной метод сжатия больших языковых моделей

По теме

Ученый выявил «алгоритмическую шизофрению» нейросетей

Школа анализа данных «Яндекса» запустила программу подготовки ученых к использованию ИИ

Сергей Марков: сценарий «Терминатора» не грозит нам ни в близком, ни в далеком будущем

Популярное

Комментарии

Последние новости:

Эффект Даннинга — Крюгера оказался частью эволюционной адаптации

Эксперт назвал ключевую технологию Starship тупиковой

Кофе защитил печень от ожирения, цирроза и рака: крупное исследование раскрыло механизмы его пользы

Родительский инстинкт оказался «перепрошитым» природой чувством голода

Кризис без дефицита: почему Россия встала в очереди за бензином и когда они закончатся

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Климатический «щелчок»: может ли Эль-Ниньо изменить привычный нам мир

Промышленный кошмар: почему терраформирование Марса может оказаться неподъемной задачей

Последние комментарии

Самые обсуждаемые

Starship впервые в истории вывел в космос полезную нагрузку — чтобы сразу сжечь ее в атмосфере

Астронавт лунной миссии предложил отказаться от посадки на южном полюсе Луны

Вспышку сверхмассивной черной дыры впервые наблюдали в реальном времени

Звуки помогли повысить урожайность