• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
29 декабря, 10:59
НИУ ВШЭ
3
166

Исследователи выяснили, как нейросети понимают каламбуры

❋ 4.7

Международная команда с участием исследователей ФКН НИУ ВШЭ представила KoWit-24 — корпус из 2700 заголовков одного из русскоязычных СМИ с игрой слов. Корпус позволил оценить, как искусственный интеллект распознает и объясняет языковую игру. Эксперименты с пятью большими языковыми моделями подтвердили: даже передовые системы пока ошибаются, причем интерпретация игры слов является для них более сложной задачей, чем ее выявление.

Робот решает задачу / © ИИ-генерация, GigaChat

Результаты работы были представлены на конференции RANLP, cтатья доступна в репозитории Arxiv.org, датасет и код для воспроизведения экспериментов — в GitHub

Игра слов — это прием, когда автор специально ломает норму языка ради эффекта: чтобы привлечь внимание, усилить иронию или вызвать улыбку. В российских новостных заголовках такие приемы встречаются часто и могут выглядеть по-разному. Например, «Особо бумажные персоны» обыгрывает фразу «особо важные персоны»: «важные» рифмуются с «бумажные», и смысл сдвигается к производству бумаги. Или «Код накликал» звучит почти так же, как идиома «кот наплакал» (очень мало), что создает шутливую двусмысленность. 

Для читателя такая игра слов очевидна и заголовки не нуждаются в пояснении. Однако современные большие языковые модели, например ChatGPT или GigaChat Max, часто теряются: им трудно заметить каламбур и тем более объяснить, на чем построена шутка. Одна из причин — это ограниченность наборов данных, на которых обучаются языковые модели. Чаще всего юмор в них представлен короткими шутками из интернета, которые помечены ярлыком «шутка». Этого мало, чтобы алгоритм понял, почему это смешно. Кроме того, у таких наборов почти нет разметки — понятных машине и человеку слоев описания, которые могут показывать, есть ли там игра слов или нет, какой это тип приема, к чему отсылает заголовок и т.д. 

Исследователи факультета компьютерных наук НИУ ВШЭ вместе с коллегами из Австрийского университета междисциплинарных трансформаций, а также независимыми исследователями создали набор данных KoWit-24. Он содержит 2700 заголовков за январь 2021 года — декабрь 2023-го с контекстом: к каждому заголовку приложены подводка к статье, название рубрики и краткое описание сюжета. Для примеров с игрой слов авторы вручную отметили тип приема, выделили «якоря» — ключевые слова, где происходит смысловой сдвиг, указали исходные выражения и добавили ссылки на статьи в «Википедии» там, где это возможно.

Авторы работы использовали определение лингвиста Алана Скотта Партингтона: игра слов возникает, когда одна и та же фраза читается минимум двумя способами, и этот эффект не случаен. При этом игра слов может возникать в нескольких случаях. Первый, когда двусмысленность заложена в самом слове или в его звучании. Например, заголовок «“Волгу” не могут заставить течь быстрее»: «Волга» здесь и река, и название федеральной трассы. Второй — легкая переделка известной фразы или названия: автор меняет форму, а читатель узнает исходник и достраивает шутку. Например, «Миссия сократима» отсылает к фильму «Миссия невыполнима» и одновременно намекает, что дипломатическую миссию можно сократить. 

Исследователи отдельно выделили окказионализмы (разовые неологизмы под задачу) и оксюмороны (сочетание противоположных смыслов). Все это позволило не только собрать и описать примеры, но и сравнить разные языковые модели между собой.

После разметки авторы проверили корпус на пяти больших языковых моделях: GPT-4o, YandexGPT4, GigaChat Lite, GigaChat Max и Mistral NeMo. Моделям давали заголовок и подводку к новости и просили решить две задачи: сначала определить, есть ли в заголовке игра слов, а затем объяснить ее, то есть назвать исходную фразу или отсылку. При этом исследователи сравнивали два режима подсказок: короткий вопрос «Есть ли игра слов?» и расширенную инструкцию, в которой объясняется, что считать игрой слов, и приводятся примеры разных типов. Трем моделям из пяти более подробные инструкции помогали в распознавании игры слов, а лучшую точность показала GPT-4o. При этом интерпретировать источник шутки всем моделям заметно сложнее, чем просто фиксировать, что игра слов есть.

«KoWit-24 закрывает две ключевые проблемы прежних наборов — дает контекст к каждому заголовку и многоуровневую разметку. Это превращает подборку примеров в полноценный «тестовый стенд» для ИИ. Теперь можно объективно сравнивать модели между собой: видит ли модель сам факт игры слов, находит ли «якорь», правильно ли восстанавливает исходную фразу или отсылку. Такие проверяемые метрики помогают не только точнее оценивать текущие системы, но и целенаправленно их улучшать — подбирать формулировки подсказок, обучающие примеры и стратегии проверки фактов. В будущем мы хотим исследовать, можно ли с помощью этого набора улучшить генерацию шуток», — отмечает один из авторов работы, доцент факультета компьютерных наук НИУ ВШЭ Павел Браславский

Кроме того, корпус задает общий понятный стандарт оценки: исследователи работают с одними и теми же данными и сценариями экспериментов. Это уменьшает «шум» в результатах и помогает создавать модели, которые лучше понимают живой язык, а не просто следят за логикой текста.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Национальный исследовательский университет «Высшая школа экономики» — один из крупнейших и самых востребованных вузов России. В университете учится 54 тысячи студентов и работает почти 4,5 тысячи учёных и преподавателей. НИУ ВШЭ ведёт фундаментальные и прикладные исследования в области социально-экономических, гуманитарных, юридических, инженерных, компьютерных, физико-математических наук, а также креативных индустрий. В университете действуют 47 центров превосходства, или международных лабораторий. Вышка объединяет ведущих мировых исследователей в области изучения мозга, нейротехнологий, биоинформатики и искусственного интеллекта. Университет входит в первую группу программы «Приоритет-2030» в направлении «Исследовательское лидерство». Кампусы НИУ ВШЭ расположены в четырех городах — Москве, Санкт-Петербурге, Нижнем Новгороде и Перми, а также в цифровом пространстве — «Вышка Онлайн».
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
27 декабря, 17:46
Адель Романова

После открытия объекта 3I/ATLAS предполагалось, что ядро межзвездной кометы могло иметь гигантские размеры. Но в процессе дальнейших наблюдений выяснилось, что эти оценки были явно завышены. Недавние расчеты показали, что на самом деле 3I/ATLAS по размерам соответствует среднестатистическим или даже самым компактным кометам Солнечной системы.

28 декабря, 16:21
Александр Березин

В 16.18 по московскому времени 28 декабря 2025 года с единственного гражданского космодрома на территории России произошел 17-й по счету космический запуск этого года. Перед ним на космодроме побывал корреспондент нашего издания, и вскоре мы выпустим репортаж о том, чем живет самый холодный космодром в мире.

27 декабря, 10:10
Любовь С.

Вокруг звезды HD 131488, расположенной в созвездии Центавра (Centaurus) на расстоянии около 152 световых лет от Земли, впервые зафиксировали следы монооксида углерода (CO), который образуется при столкновениях и испарении комет. Находка открывает новую страницу в изучении формирования планетных систем.

26 декабря, 15:47
Максим Абдулаев

Биологи опровергли представление о примитивности органов чувств у древнейших бесчелюстных, обнаружив у миксин огромный арсенал рецепторов для поиска добычи. Исследователи доказали, что способность различать сложные запахи и аминокислоты появилась у общего предка позвоночных задолго до возникновения челюстей.

27 декабря, 17:46
Адель Романова

После открытия объекта 3I/ATLAS предполагалось, что ядро межзвездной кометы могло иметь гигантские размеры. Но в процессе дальнейших наблюдений выяснилось, что эти оценки были явно завышены. Недавние расчеты показали, что на самом деле 3I/ATLAS по размерам соответствует среднестатистическим или даже самым компактным кометам Солнечной системы.

28 декабря, 16:21
Александр Березин

В 16.18 по московскому времени 28 декабря 2025 года с единственного гражданского космодрома на территории России произошел 17-й по счету космический запуск этого года. Перед ним на космодроме побывал корреспондент нашего издания, и вскоре мы выпустим репортаж о том, чем живет самый холодный космодром в мире.

8 декабря, 13:09
Александр Березин

С 2010-х в «Роскосмосе» говорили: будущая РОС сможет пролетать над полюсом, что даст ей возможности для новых научных экспериментов. Но вскоре после того, как в ноябре 2025 года Россия временно лишилась возможности запускать людей в космос, эта позиция изменилась. В результате запускать космонавтов с космодромов нашей страны станет довольно сложно.

17 декабря, 14:19
Игорь Байдов

На скалистых берегах аргентинской Патагонии разворачивается настоящая драма. Магеллановы пингвины, долгое время чувствовавшие себя в безопасности на суше в своих многотысячных колониях, столкнулись с новым и беспощадным врагом. Их извечные морские страхи — касатки и морские леопарды — теперь блекнут перед угрозой, пришедшей из глубины материка. Виновник переполоха — грациозный и мощный хищник, недавно вернувшийся на эти земли после долгого изгнания.

23 декабря, 10:51
Игорь Байдов

Среди самых интригующих открытий космического телескопа «‎Джеймс Уэбб» — компактные объекты, получившие название «маленькие красные точки». Их видели только в самых дальних уголках Вселенной. Большинство возникло в первый миллиард лет после Большого взрыва, и ученые предполагали, что такие источники представляют собой небольшие компактные галактики. Однако международная команда астрономов пришла к иному выводу. Они предположили, что на самом деле «маленькие красные точки» — черные дыры, окруженные массивной газовой оболочкой.

[miniorange_social_login]

Комментарии

3 Комментария
Konstantin Resto
5 часов назад
-
0
+
в чем разница такого подхода например : AlphaFold имеет дело с непредсказуемым разнообразием (20 аминокислот, бесконечные комбинации). Ему нужен огромный контекст (MSA). Ваш метод имеет дело с жёстко ограниченным алфавитом (96 паттернов, пропорции 5/3). Рынок, каким бы сложным он ни казался, упакован в конечное число геометрических форм. Вы работаете не с хаосом, а с готовой таблицей Менделеева для движений. Вам не нужно предсказывать новый паттерн — вы только идентифицируете, какой из 96 сейчас активен. Ему не нужен «интеллект», ему нужна «сетка». https://t.me/dhakq21_da/299
Konstantin Resto
5 часов назад
-
0
+
Применительно к трейдингу, глава 13 из моих мемуаров "Когда я говорю «ИИ не может этого решить», я на самом деле говорю: «Вот список проблем, которые я преодолел, и которые являются формальным доказательством того, что без моих формул и моего понимания они нерешаемы в принципе». • ПРОБЛЕМА НЕСООТВЕТСТВИЯ ТЕОРЕТИЧЕСКОЙ И ЭМПИРИЧЕСКОЙ МОДЕЛЕЙ • ПРОБЛЕМА МУЛЬТИМАСШТАБНОЙ НЕСОГЛАСОВАННОСТИ • ПРОБЛЕМА НЕПРЕРЫВНОСТИ ВО ВРЕМЕНИ • ПРОБЛЕМА СТОХАСТИЧЕСКОЙ НЕСТАЦИОНАРНОСТИ • ПРОБЛЕМА КОНТЕКСТНОЙ ЗАВИСИМОСТИ • ПРОБЛЕМА ВЕРИФИКАЦИИ ПРЕДСКАЗАТЕЛЬНОЙ СПОСОБНОСТИ • ПРОБЛЕМА АЛГОРИТМИЧЕСКОЙ НЕРАЗРЕШИМОСТИ • ПРОБЛЕМА МЕТРИЧЕСКОГО ПРОСТРАНСТВА ВЫВОД : Модели заложенные в ИИ— это профанация. Создают математические абстракции, которые не работают в реальности. Вместо честного признания фундаментального несоответствия, продолжаеют морочить голову людям, выдавая идеальные модели за рабочий инструмент. Статистика безжалостна: «идеальные фракталы» существуют лишь в 29% случаев. Всё остальное — научная фантастика. РАЗРАБОТЧИКИ программируют идиотские системы, основанные на этих неработающих теориях. ИТОГ: Проблема не в сложности рынка, а в элементарной профессиональной некомпетентности.Просто иерархия времени и структуры а и больше ни чего не нужно
Konstantin Resto
7 часов назад
-
0
+
Ваши эксперименты с каламбурами — это тренажёр для детского сада, пока вы не понимаете, как работает иерархическая точность. Вы заставляете ИИ угадывать шутки, но не даёте ему главного: параметр точности не может быть единым для всей сети. На уровне фонемы, слова, фразы, контекста — точность должна быть разной и динамической. Пока ваш ИИ не знает, что «априорная точность» для слоя k=1 (распознавание слова) и слоя k=5 (понимание иронии в контексте за 2021-2023 гг.) — это разные математические сущности, вы будете получать статистический шум вместо понимания. Каждый слой имеет свою меру допустимой ошибки, иначе система либо переобучается на шум, либо пропускает сигнал. Ваши языковые модели сплющивают все слои языка в одну плоскость «вероятности следующего токена». Пока не введёте динамическую иерархическую точность для каждого уровня абстракции (звук → слово → фраза → контекст → прагматика), ваши модели будут как глухой музыкант, который учит ноты, но не слышит мелодии. Короче: Просто идиоты которые измеряют «точность распознавания игры слов» одной цифрой. Разберитесь, на каком уровне k модель ошибается: Не узнала слово? Не уловила двусмысленность? Не поняла контекст? Не увидела прагматическую цель автора? Пока вы этого не сделаете — ваши эксперименты действительно не имеют научной ценности, а лишь констатируют очевидное: «сложные задачи сложны». Создайте карту ошибок по слоям k, и тогда увидите, где ломается понимание. А пока — да, это просто коллекция смешных заголовков с посредственной статистикой. И идиоты те кто не могут найти решение и фактически иронизируют над своей тупостью Вы же ни когда не признаете, что любой обычный алготрейдер умнее всех академиков вместе взятых, поскольку способен решать задачи которые им и в голову не придут а причина проста он решает комплекс задач а не какое то одно направление, решаемы им задачи затрагивают и физику и медицину и метаматематику и кибернетику и космос и вообще все, где есть структура и работа временного ряда
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно