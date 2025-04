Работа моделей искусственного интеллекта основана на предположении, что слова в естественных языках не выстраиваются в словосочетания и предложения случайным образом, а подчиняются неким статистическим закономерностям. Нейросети анализируют уже существующие тексты на том или ином языке, извлекают эти закономерности и генерируют собственные последовательности слов. Недавние исследования показали, что нейросети способны создавать стихи, которые нравятся людям больше творчества поэтов-классиков, а также что алгоритм лучше всего «выучивает» характерные для людей цветовые ассоциации благодаря предложениям с определенными словами.

Специалисты из Института Вейцмана в Израиле обратили внимание на то, что современному искусственному интеллекту недоступна информация о содержании человеческой речи, которое выражается не в словах, а в интонации, длительности пауз и других особенностях просодии. Они изучили эти характеристики на материале английского языка и опубликовали статью в научном журнале Proceedings of the National Academy of Sciences.

Авторы работы проанализировали два корпуса аудиозаписей спонтанных разговоров и материал трех аудиокниг на английском языке. Им удалось выделить перечень коротких «мелодий», которые играют роль слов, то есть становятся элементами, составляющими более длинные фразы. Исследователи составили словарь англоязычной просодии, определив для каждого такого «слова» функцию и значение.

Давно известно, что просодия — неотъемлемая часть любого разговора. Благодаря ей мы, например, различаем вопрос и восклицание, не путаем шутку с серьезным высказыванием, правильно считываем отношение говорящего к предмету обсуждения. Однако составление словаря позволило ученым выявить просодические законы, по структуре напоминающие грамматику самостоятельного языка, например правила, по которым составляются «предложения» из «мелодий-слов».

По мнению авторов исследования, их работа «закладывает основу для автоматизированной системы составления “словаря” просодии для каждого человеческого языка и для разных групп говорящих». Такой материал в дальнейшем может позволить обучать модели искусственного интеллекта разным языкам, не используя слова.

