Израильские исследователи обнаружили, что просодия — характеристики речи вроде интонации, темпа, ритма — напоминает отдельную систему знаков. Благодаря этому ее свойству, вероятно, получится создать искусственный интеллект, который будет «понимать» язык без слов.
Для английского языка составили словарь просодии / © N. Matalon et al., PNAS
Работа моделей искусственного интеллекта основана на предположении, что слова в естественных языках не выстраиваются в словосочетания и предложения случайным образом, а подчиняются неким статистическим закономерностям. Нейросети анализируют уже существующие тексты на том или ином языке, извлекают эти закономерности и генерируют собственные последовательности слов. Недавние исследования показали, что нейросети способны создавать стихи, которые нравятся людям больше творчества поэтов-классиков, а также что алгоритм лучше всего «выучивает» характерные для людей цветовые ассоциации благодаря предложениям с определенными словами.
Специалисты из Института Вейцмана в Израиле обратили внимание на то, что современному искусственному интеллекту недоступна информация о содержании человеческой речи, которое выражается не в словах, а в интонации, длительности пауз и других особенностях просодии. Они изучили эти характеристики на материале английского языка и опубликовали статью в научном журнале Proceedings of the National Academy of Sciences.
Авторы работы проанализировали два корпуса аудиозаписей спонтанных разговоров и материал трех аудиокниг на английском языке. Им удалось выделить перечень коротких «мелодий», которые играют роль слов, то есть становятся элементами, составляющими более длинные фразы. Исследователи составили словарь англоязычной просодии, определив для каждого такого «слова» функцию и значение.
Давно известно, что просодия — неотъемлемая часть любого разговора. Благодаря ей мы, например, различаем вопрос и восклицание, не путаем шутку с серьезным высказыванием, правильно считываем отношение говорящего к предмету обсуждения. Однако составление словаря позволило ученым выявить просодические законы, по структуре напоминающие грамматику самостоятельного языка, например правила, по которым составляются «предложения» из «мелодий-слов».
По мнению авторов исследования, их работа «закладывает основу для автоматизированной системы составления “словаря” просодии для каждого человеческого языка и для разных групп говорящих». Такой материал в дальнейшем может позволить обучать модели искусственного интеллекта разным языкам, не используя слова.