29.12.2025, 10:59

НИУ ВШЭ

Исследователи выяснили, как нейросети понимают каламбуры

❋ 4.7

Международная команда с участием исследователей ФКН НИУ ВШЭ представила KoWit-24 — корпус из 2700 заголовков одного из русскоязычных СМИ с игрой слов. Корпус позволил оценить, как искусственный интеллект распознает и объясняет языковую игру. Эксперименты с пятью большими языковыми моделями подтвердили: даже передовые системы пока ошибаются, причем интерпретация игры слов является для них более сложной задачей, чем ее выявление.

НИУ ВШЭ

# искусственный интеллект

# лингвистика

# нейросети

# русский язык

# технологии

Робот решает задачу / © ИИ-генерация, GigaChat

Результаты работы были представлены на конференции RANLP, cтатья доступна в репозитории Arxiv.org, датасет и код для воспроизведения экспериментов — в GitHub.

Игра слов — это прием, когда автор специально ломает норму языка ради эффекта: чтобы привлечь внимание, усилить иронию или вызвать улыбку. В российских новостных заголовках такие приемы встречаются часто и могут выглядеть по-разному. Например, «Особо бумажные персоны» обыгрывает фразу «особо важные персоны»: «важные» рифмуются с «бумажные», и смысл сдвигается к производству бумаги. Или «Код накликал» звучит почти так же, как идиома «кот наплакал» (очень мало), что создает шутливую двусмысленность.

Для читателя такая игра слов очевидна и заголовки не нуждаются в пояснении. Однако современные большие языковые модели, например ChatGPT или GigaChat Max, часто теряются: им трудно заметить каламбур и тем более объяснить, на чем построена шутка. Одна из причин — это ограниченность наборов данных, на которых обучаются языковые модели. Чаще всего юмор в них представлен короткими шутками из интернета, которые помечены ярлыком «шутка». Этого мало, чтобы алгоритм понял, почему это смешно. Кроме того, у таких наборов почти нет разметки — понятных машине и человеку слоев описания, которые могут показывать, есть ли там игра слов или нет, какой это тип приема, к чему отсылает заголовок и т.д.

Исследователи факультета компьютерных наук НИУ ВШЭ вместе с коллегами из Австрийского университета междисциплинарных трансформаций, а также независимыми исследователями создали набор данных KoWit-24. Он содержит 2700 заголовков за январь 2021 года — декабрь 2023-го с контекстом: к каждому заголовку приложены подводка к статье, название рубрики и краткое описание сюжета. Для примеров с игрой слов авторы вручную отметили тип приема, выделили «якоря» — ключевые слова, где происходит смысловой сдвиг, указали исходные выражения и добавили ссылки на статьи в «Википедии» там, где это возможно.

Авторы работы использовали определение лингвиста Алана Скотта Партингтона: игра слов возникает, когда одна и та же фраза читается минимум двумя способами, и этот эффект не случаен. При этом игра слов может возникать в нескольких случаях. Первый, когда двусмысленность заложена в самом слове или в его звучании. Например, заголовок «“Волгу” не могут заставить течь быстрее»: «Волга» здесь и река, и название федеральной трассы. Второй — легкая переделка известной фразы или названия: автор меняет форму, а читатель узнает исходник и достраивает шутку. Например, «Миссия сократима» отсылает к фильму «Миссия невыполнима» и одновременно намекает, что дипломатическую миссию можно сократить.

Исследователи отдельно выделили окказионализмы (разовые неологизмы под задачу) и оксюмороны (сочетание противоположных смыслов). Все это позволило не только собрать и описать примеры, но и сравнить разные языковые модели между собой.

После разметки авторы проверили корпус на пяти больших языковых моделях: GPT-4o, YandexGPT4, GigaChat Lite, GigaChat Max и Mistral NeMo. Моделям давали заголовок и подводку к новости и просили решить две задачи: сначала определить, есть ли в заголовке игра слов, а затем объяснить ее, то есть назвать исходную фразу или отсылку. При этом исследователи сравнивали два режима подсказок: короткий вопрос «Есть ли игра слов?» и расширенную инструкцию, в которой объясняется, что считать игрой слов, и приводятся примеры разных типов. Трем моделям из пяти более подробные инструкции помогали в распознавании игры слов, а лучшую точность показала GPT-4o. При этом интерпретировать источник шутки всем моделям заметно сложнее, чем просто фиксировать, что игра слов есть.

«KoWit-24 закрывает две ключевые проблемы прежних наборов — дает контекст к каждому заголовку и многоуровневую разметку. Это превращает подборку примеров в полноценный «тестовый стенд» для ИИ. Теперь можно объективно сравнивать модели между собой: видит ли модель сам факт игры слов, находит ли «якорь», правильно ли восстанавливает исходную фразу или отсылку. Такие проверяемые метрики помогают не только точнее оценивать текущие системы, но и целенаправленно их улучшать — подбирать формулировки подсказок, обучающие примеры и стратегии проверки фактов. В будущем мы хотим исследовать, можно ли с помощью этого набора улучшить генерацию шуток», — отмечает один из авторов работы, доцент факультета компьютерных наук НИУ ВШЭ Павел Браславский.

Кроме того, корпус задает общий понятный стандарт оценки: исследователи работают с одними и теми же данными и сценариями экспериментов. Это уменьшает «шум» в результатах и помогает создавать модели, которые лучше понимают живой язык, а не просто следят за логикой текста.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Национальный исследовательский университет «Высшая школа экономики» — один из крупнейших и самых востребованных вузов России. В университете учится 54 тысячи студентов и работает почти 4,5 тысячи учёных и преподавателей. НИУ ВШЭ ведёт фундаментальные и прикладные исследования в области социально-экономических, гуманитарных, юридических, инженерных, компьютерных, физико-математических наук, а также креативных индустрий. В университете действуют 47 центров превосходства, или международных лабораторий. Вышка объединяет ведущих мировых исследователей в области изучения мозга, нейротехнологий, биоинформатики и искусственного интеллекта. Университет входит в первую группу программы «Приоритет-2030» в направлении «Исследовательское лидерство». Кампусы НИУ ВШЭ расположены в четырех городах — Москве, Санкт-Петербурге, Нижнем Новгороде и Перми, а также в цифровом пространстве — «Вышка Онлайн».

НИУ ВШЭ

# искусственный интеллект

# лингвистика

# нейросети

# русский язык

# технологии

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Кометы: тысячелетняя история мифов и суеверий

Павильон «АТОМ»

Москва

Лекция

03 Апр

Бесплатно

Что нового в динозаврах?

Павильон «АТОМ»

Москва

Павильон «АТОМ»

Москва

Лекция

03 Апр

Бесплатно

Древняя ДНК и история эпидемий

Павильон «АТОМ»

Москва

Лекция

03 Апр

Бесплатно

О роли ДНК-исследований в реконструкции истории человечества

СПбГУ

Санкт-Петербург

Лекция

04 Апр

1000 ₽

Как русский язык не перешел на латиницу

Medio Modo

Москва

Лекция

04 Апр

Бесплатно

Профессия — инженер в области искусственного интеллекта

Музей криптографии

Москва

Лекция

04 Апр

Бесплатно

Человек в экстремальной среде обитания: от океана до космоса

Космонавтика и авиация

Москва

Лекция

04 Апр

Бесплатно

Сравнительная мифология

Библиотека им. Маяковского

Санкт-Петербург

Популярное

За сутки

За неделю

За месяц

1 апреля, 16:17

Александр Березин

Ученые рассчитали, как разогреть Марс всего за 15 лет

Единственной планетой Солнечной системы, подходящей для терраформирования, остается Марс. Однако способы разогреть его с помощью суперпарниковых газов требовали веков времени. Согласно расчетам из новой работы, микрочастицы особой формы могут сделать то же самое куда быстрее и дешевле.

Астрономия

# аэрозоли

# марс

# терраформирование Марса

31 марта, 12:11

Андрей Серегин

Ученые подтвердили происхождение грузинского алфавита от армянского

Связь разных культур всего мира иногда находится в самых неожиданных инструментах, в том числе в языке. Новое исследование впервые показало такую связь количественно.

История

# алфавит

# Кавказ

# культура

# Эфиопия

# языки

2 апреля, 15:45

Любовь С.

Астрономический архив подтвердил 35 неизвестных летающих объектов на околоземной орбите

Загадочные вспышки, зафиксированные на астрономических фотопластинках в 1950-х годах, могут оказаться следами неизвестных объектов на орбите Земли. Если это подтвердится, ученые получат новый инструмент для поиска необычных космических событий, включая потенциальные техносигнатуры.

Астрономия

# вспышки

# вспышки звезд

# звезды

# Обсерватории

# снимки

# техносигнатуры

28 марта, 15:51

Максим Абдулаев

Первая запись родов кашалота доказала существование взаимопомощи внутри стаи

Морские биологи впервые детально задокументировали процесс родов у диких кашалотов. Анализ видеозаписей и акустических сигналов показал, что самки из разных родственных линий временно объединяются, чтобы по очереди выталкивать новорожденного на поверхность для дыхания. Это первое доказательство взаимопомощи при родах между неродственными особями у видов, не относящихся к приматам.

Биология

# водные роды

# дельфины

# кашалоты

# китообразные

# поведение животных

# этология

1 апреля, 16:17

Александр Березин

Ученые рассчитали, как разогреть Марс всего за 15 лет

Астрономия

# аэрозоли

# марс

# терраформирование Марса

31 марта, 12:11

Андрей Серегин

Ученые подтвердили происхождение грузинского алфавита от армянского

История

# алфавит

# Кавказ

# культура

# Эфиопия

# языки

19 марта, 12:41

Игорь Байдов

На Марсе впервые обнаружили следы корунда — минерала, из которого на Земле формируются рубины и сапфиры

Марсоход «Персеверанс» обнаружил в камнях на кромке кратера Езеро спектральные признаки минерала корунда, из которого на Земле образуются рубины и сапфиры. Такие спектры на Красной планете зарегистрировали впервые. Теперь ученые пытаются понять, при каких процессах он мог там сформироваться, ведь условия на Марсе заметно отличаются от тех, в которых корунд обычно образуется на Земле.

Астрономия

# кратер езеро

# марс

# минералы

# Персеверанс

# рубины

# сапфиры

3 марта, 14:06

Александр Березин

Россия вернула себе возможность пилотируемых космических полетов

В ноябре 2025 года при взлете российской ракеты с Байконура к МКС с существенной высоты упала кабина обслуживания 8У216. Поскольку в 2010-х годах из экономии средств у нас отказались от дублирования стартовых площадок, это создало ситуацию временной невозможности пилотируемых полетов. Теперь, всего через три месяца после происшествия, «Роскосмос» смог решить проблему, поставив запасную кабину обслуживания, найденную на складах Минобороны. Весенние пуски к МКС, запланированные ранее, теперь имеют шансы пройти в срок.

Космонавтика

# Байконур

# космонавтика

# космос

# Роскосмос

# Россия

5 марта, 08:10

Александр Березин

Иран против США: технологические возможности стран на поле боя

Одна сторона сыплет более дорогими и сложными баллистическими ракетами, другая — относительно дешевыми крылатыми. Но при этом первая на порядок беднее второй. А что у них с технологическим уровнем для наземной войны, и почему, кстати, глава второй избегает даже самого этого слова? Попробуем разобраться в реальных возможностях военных машин сторон потенциально самого опасного конфликта 2026 года.

Оружие и техника

# беспилотники

# военная техника

# ВПК

# ЗРК

# Израиль

# Иран

# сша

Выбор редакции

[miniorange_social_login]

Исследователи выяснили, как нейросети понимают каламбуры

По теме

Экзамен на выносливость: в России cоздали первый масштабный набор тестов для нейросетей на «понимание» длинных текстов

Исследователи из МГУ и «Яндекса» создали первый открытый датасет и метод обучения нейросетей сложным правилам русского языка

Искусственный интеллект обретает здравомыслие: новый метод заставил нейросети сомневаться в своих ответах

Популярное

Ученые рассчитали, как разогреть Марс всего за 15 лет

Ученые подтвердили происхождение грузинского алфавита от армянского

Астрономический архив подтвердил 35 неизвестных летающих объектов на околоземной орбите

Первая запись родов кашалота доказала существование взаимопомощи внутри стаи

Ученые рассчитали, как разогреть Марс всего за 15 лет

Ученые подтвердили происхождение грузинского алфавита от армянского

На Марсе впервые обнаружили следы корунда — минерала, из которого на Земле формируются рубины и сапфиры

Россия вернула себе возможность пилотируемых космических полетов

Иран против США: технологические возможности стран на поле боя

Комментарии

Хотите
вести колонку
в нашем
издании?

Колумнисты 66

ПНИПУ

ФизТех

НИУ ВШЭ

Сколтех

ТюмГУ

РНФ

ЮФУ

МГППУ

РТУ МИРЭА

НИТУ МИСИС

В тесноте и в обиде: психология коммунального быта

Рукопись Войнича: как ученые делают сенсации из ничего

Фотографии, которые потрясли мир

Связанные одной сетью: будет ли человек жить в виртуальном мире?

Зеркало души

10 гаджетов для тех, кого не отпускает прошлое

Главный внештатный пульмонолог Минздрава Сергей Авдеев — о старении орфанных болезней, поддержке от профессионалов и российских фармацевтических прорывах

Как живут на МКС: физкультура, гигиена и невесомые весы

Исследователи выяснили, как нейросети понимают каламбуры

По теме

Экзамен на выносливость: в России cоздали первый масштабный набор тестов для нейросетей на «понимание» длинных текстов

Исследователи из МГУ и «Яндекса» создали первый открытый датасет и метод обучения нейросетей сложным правилам русского языка

Искусственный интеллект обретает здравомыслие: новый метод заставил нейросети сомневаться в своих ответах

Популярное

Комментарии

Хотите вести колонку в нашем издании?

Колумнисты 66

ПНИПУ

ФизТех

НИУ ВШЭ

Сколтех

ТюмГУ

РНФ

ЮФУ

МГППУ

РТУ МИРЭА

НИТУ МИСИС

Хотите
вести колонку
в нашем
издании?