Нейронные языковые модели расширили освоение человеческой речи — Naked Science
6 минут
Сколтех
1

Нейронные языковые модели расширили освоение человеческой речи

4.7

Исследователи Сколтеха и их коллеги провели первое в своем роде масштабное вычислительное исследование, в ходе которого сравнили самые современные языковые модели на основе нейронных сетей и оценили их возможности по решению одной из важнейших задач обработки естественного языка – лексической замены.

Нейронные языковые модели углубили освоение человеческой речи / ©Getty images

Результаты исследования были представлены на 28-й Международной конференции по компьютерной лингвистике (COLING-2020). Лексическая замена – это замена слова в предложении на другое слово, которое тем или иным образом связано с исходным словом и подходит для употребления в данном контексте. Например, в предложении «Пётр Ильич Чайковский – великий русский композитор» слово «великий» можно заменить синонимом «выдающийся».

В предложении «Мой брат − профессиональный теннисист» слово «теннисист» можно заменить на гипероним (то есть слово с более широким значением) «спортсмен», а вместо фразы «Я сегодня на машине» автомобилист вполне может сказать: «Я сегодня на колесах» (слово «колесо» является меронимом, то есть понятием, обозначающим составную часть целого предмета).

Для человека как носителя языка лексическая замена – вещь вполне простая и естественная, чего нельзя сказать о компьютере, решающем задачи обработки естественного языка (NLP). Компьютеру приходится «овладевать навыками» индукции, чтобы научиться определять значение слова по контексту, исправлять орфографические ошибки в зависимости от смысла слова и даже решать более сложные задачи, например, перефразирование или упрощение текста.

Именно для решения таких задач и создаются языковые модели на основе глубоких нейронных сетей, способные выполнять лексическую замену в зависимости от ближайшего контекста целевого слова. Старший преподаватель Сколтеха Александр Панченко и его коллеги из Исследовательского центра Samsung в России, НИУ ВШЭ и МГУ имени М. В. Ломоносова сравнили пять языковых моделей на основе нейронных сетей, поставив перед ними две задачи − собственно лексическая замена и индукция значения слова (во втором случае компьютер должен был уловить разницу между омонимами, например, словом «среда» в значении «окружающая среда» или «день недели»).

По мнению ученых, полученные результаты могут оказаться полезными при решении чисто практических задач NLP. В частности, исследователи показали связь между конкретной моделью и типом семантических отношений между словами (синоним, омоним, гипероним и так далее), а также установили, что наличие дополнительной информации о целевом слове позволяет значительно (или существенно, если продолжать тему синонимов) улучшить качество лексической замены.

«Во-первых, результаты нашего исследования по лексической замене можно применять для целей изучения языка (замена слов на более простые). Во-вторых, их можно использовать для аугментации текстовых данных при обучении нейронных сетей. Аналогичные методы аугментации уже широко используются в компьютерном зрении, а вот в анализе текста они пока применяются не так часто. Также вполне реально использовать их при написании текстов в качестве вспомогательного средства для автоматического подбора синонимов и перефразирования текста», − отмечает Александр Панченко.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Сколковский институт науки и технологий — негосударственный технологический университет, расположенный в инновационном центре Сколково. Институт был создан в 2011 году при поддержке Массачусетского технологического института. Модель института предусматривает тесную интеграцию технологического образования, исследовательской работы и предпринимательских навыков. Институт ведёт обучение по программам магистратуры и PhD, рабочий язык — английский.
Позавчера, 14:46
5 минут
Илья Ведмеденко

Снимки демонстрируют интерьер новой российской атомной многоцелевой субмарины — К-561 «Казань», принадлежащей к проекту 885М «Ясень-М».

Позавчера, 11:25
55 минут
Александр Березин

Два миллиона лет назад планета вошла в состояние крайне необычной неустойчивости. Раз за разом она стирала экосистемы Африки с лица земли, отчего наши предки снова и снова оказывались в сложном положении. Семьдесят тысяч лет назад их число сократилось в десять раз — ударил другой, совершенно неожиданный фактор. Пару сотен тысяч лет назад не только человечество, но вообще все наземные виды могли погибнуть от еще более разрушительной силы. 12,9 тысячи лет назад множество людей умерли и миллионы квадратных километров полностью выгорели из-за взрывов в атмосфере и огненного дождя. Как именно наш вид пережил все это?

39 минут назад
9 минут
Мария Азарова

Китайские ученые воспроизвели модель мужской беременности млекопитающих на лабораторных крысах: результаты оказались успешными лишь отчасти, но все равно показали, что в таких случаях эмбрионы могут развиваться нормально. Мировое сообщество восприняло эксперимент с ужасом.

Позавчера, 14:46
5 минут
Илья Ведмеденко

Снимки демонстрируют интерьер новой российской атомной многоцелевой субмарины — К-561 «Казань», принадлежащей к проекту 885М «Ясень-М».

Позавчера, 11:25
55 минут
Александр Березин

Два миллиона лет назад планета вошла в состояние крайне необычной неустойчивости. Раз за разом она стирала экосистемы Африки с лица земли, отчего наши предки снова и снова оказывались в сложном положении. Семьдесят тысяч лет назад их число сократилось в десять раз — ударил другой, совершенно неожиданный фактор. Пару сотен тысяч лет назад не только человечество, но вообще все наземные виды могли погибнуть от еще более разрушительной силы. 12,9 тысячи лет назад множество людей умерли и миллионы квадратных километров полностью выгорели из-за взрывов в атмосфере и огненного дождя. Как именно наш вид пережил все это?

18 июня
9 минут
Мария Азарова

Шотландские исследователи провели когортный анализ: они сравнили риск госпитализации при заражении индийским и британским штаммами коронавируса, а также определили, кого вариант из Индии поражает чаще всего.

24 мая
23 минуты
Ольга Иванова

«Сексуальную революцию совершили задние сиденья автомобилей», – заявил в свое время американский общественный деятель Джерри Рубин. И ошибся. Раскрепощение нравов происходило задолго до появления машин, причем много раз. Оно напоминает движение маятника. Как и почему вершились «секшал революшнс» и стоим ли мы на пороге нового витка сексуальности или же нас ждет ужесточение морали? Об этом – в нашем материале.

9 июня
4 минуты
Ольга Иванова

Международная команда исследователей изучила геологию и условия существования самого большого моря в истории планеты — Паратетиса.

27 мая
51 минута
Александр Березин

Хотя в прессе много пишут об исключительно редких «побочках» от вакцин, практика показывает, что бояться надо совсем другого. Самым страшным врагом привитого остается... коронавирус. Даже после вакцин Pfizer или Moderna от него иногда умирают — и подобных случаев уже сотни. Разумеется, среди непривитых таких на порядки больше, но погибшим и членам их семей от этого не легче. Еще хуже то, что две из трех российских вакцин, похоже, защищают от ковида намного слабее Pfizer и Moderna. Это довольно странно с учетом того, что третий российский препарат в этом плане не уступает западным аналогам. Почему российские власти финансируют миллионные тиражи слабой вакцины, имея в распоряжении вполне полноценную?

[miniorange_social_login]

Комментарии

1 Комментарий

-
2
+
Материалы Сколтеха комментировать нельзя?!.. Всяко, мне это уже дважды не удалось...Вот сейчас попробовал, опять новый комментарий не появился. Сейчас проверю, можно ли критиковать, отредактировав уже прошедшую реплику?..Читаешь вот такое -- "для аугментации текстовых данных" -- и невольно вспоминаешь профессора Преображенского: "Потрудитесь излагать ваши мысли яснее..." Даже слазив в интернет не нашел значения слова "аугментация", применимого к машинному лингвистическому анализу текстов, а только к музыке, стоматологии и компьютерным играм... Друг наш, Сколтех, об одном тебя прошу: не говори красиво... А если уж говоришь, то сказанное сложно поясняй простыми словами...
Подтвердить?
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: