13.05.2021, 11:24

Сколтех

Нейронные языковые модели расширили освоение человеческой речи

❋ 4.7

Исследователи Сколтеха и их коллеги провели первое в своем роде масштабное вычислительное исследование, в ходе которого сравнили самые современные языковые модели на основе нейронных сетей и оценили их возможности по решению одной из важнейших задач обработки естественного языка – лексической замены.

Сколтех

# лексика

# лексическая замена

# нейронные языки

# речь

# человек

Нейронные языковые модели углубили освоение человеческой речи / ©Getty images / Автор: Visellia Orfius

Результаты исследования были представлены на 28-й Международной конференции по компьютерной лингвистике (COLING-2020). Лексическая замена – это замена слова в предложении на другое слово, которое тем или иным образом связано с исходным словом и подходит для употребления в данном контексте. Например, в предложении «Пётр Ильич Чайковский – великий русский композитор» слово «великий» можно заменить синонимом «выдающийся».

В предложении «Мой брат − профессиональный теннисист» слово «теннисист» можно заменить на гипероним (то есть слово с более широким значением) «спортсмен», а вместо фразы «Я сегодня на машине» автомобилист вполне может сказать: «Я сегодня на колесах» (слово «колесо» является меронимом, то есть понятием, обозначающим составную часть целого предмета).

Для человека как носителя языка лексическая замена – вещь вполне простая и естественная, чего нельзя сказать о компьютере, решающем задачи обработки естественного языка (NLP). Компьютеру приходится «овладевать навыками» индукции, чтобы научиться определять значение слова по контексту, исправлять орфографические ошибки в зависимости от смысла слова и даже решать более сложные задачи, например, перефразирование или упрощение текста.

Именно для решения таких задач и создаются языковые модели на основе глубоких нейронных сетей, способные выполнять лексическую замену в зависимости от ближайшего контекста целевого слова. Старший преподаватель Сколтеха Александр Панченко и его коллеги из Исследовательского центра Samsung в России, НИУ ВШЭ и МГУ имени М. В. Ломоносова сравнили пять языковых моделей на основе нейронных сетей, поставив перед ними две задачи − собственно лексическая замена и индукция значения слова (во втором случае компьютер должен был уловить разницу между омонимами, например, словом «среда» в значении «окружающая среда» или «день недели»).

По мнению ученых, полученные результаты могут оказаться полезными при решении чисто практических задач NLP. В частности, исследователи показали связь между конкретной моделью и типом семантических отношений между словами (синоним, омоним, гипероним и так далее), а также установили, что наличие дополнительной информации о целевом слове позволяет значительно (или существенно, если продолжать тему синонимов) улучшить качество лексической замены.

«Во-первых, результаты нашего исследования по лексической замене можно применять для целей изучения языка (замена слов на более простые). Во-вторых, их можно использовать для аугментации текстовых данных при обучении нейронных сетей. Аналогичные методы аугментации уже широко используются в компьютерном зрении, а вот в анализе текста они пока применяются не так часто. Также вполне реально использовать их при написании текстов в качестве вспомогательного средства для автоматического подбора синонимов и перефразирования текста», − отмечает Александр Панченко.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Сколковский институт науки и технологий — негосударственный технологический университет, расположенный в инновационном центре Сколково. Институт был создан в 2011 году при поддержке Массачусетского технологического института. Модель института предусматривает тесную интеграцию технологического образования, исследовательской работы и предпринимательских навыков. Институт ведёт обучение по программам магистратуры и PhD, рабочий язык — английский.

Сколтех

# лексика

# лексическая замена

# нейронные языки

# речь

# человек

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Космическая импровизация: как Солнце создает хаос и порядок

Сколтех

Москва

Экскурсия

12 Июл

Бесплатно

Экскурсия в Музей Истории Мироздания

Курилка Гутенберга

Москва

Лекция

12 Июл

1700 ₽

Путешествие с кошкой Шредингера по квантовой запутанности: от параллельных вселенных до квантового компьютера

ВСмысле

Санкт-Петербург

Лекция

12 Июл

Бесплатно

Свет в ловушке: резонансные эффекты в наномасштабе

Сколтех

Москва

Лекция

12 Июл

700 ₽

Партия социалистов-революционеров: портреты

Центр «Архэ»

Москва

Лекция

12 Июл

Бесплатно

Звериный взгляд на красоту

Сколтех

Москва

Лекция

12 Июл

Бесплатно

Наука и искусство измерения времени

Сколтех

Москва

Лекция

13 Июл

Бесплатно

Органическая химия азота для медицины и освоения космоса

Космонавтика и авиация

Москва

Лекция

13 Июл

Бесплатно

Насколько огромна Вселенная?

Космонавтика и авиация

Москва

Популярное

За сутки

За неделю

За месяц

9 июля, 08:26

Полина Меньшова

Предпочтения в спорте связали с типом личности

Подобрать тип физической активности, который лучше всего подходит человеку, можно исходя из особенностей его характера. Психологи из Великобритании определили, что люди с разными чертами личности получают больше удовольствия от разных видов спорта.

Психология

# спорт

# тип личности

# фитнес

# характер

# черты личности

11 июля, 17:47

Денис Яковлев

Ученые определили оптимальную длительность физической активности, которая продлевает жизнь на треть

Международная команда ученых оценила связь между длительностью физической активности, ее интенсивностью, риском смерти от всех причин и вероятностью развития сердечно-сосудистых и онкологических заболеваний.

Медицина

# ЗОЖ

# онкологические заболевания

# сердечно-сосудистые болезни

# смертность

# спорт

10 июля, 13:16

ФизТех

Скрутить в кольцо и сломать позвоночник: ученые узнали, как крестьяне наказывали конокрадов в царской России

Кража лошадей была серьезной проблемой для крестьянских хозяйств в Российской империи. Особенности этого явления, включающие жестокие уголовные наказания, крестьянский самосуд и межэтнические конфликты, выявили в ходе исследования юридических источников историки из МФТИ и РЭУ имени Г.В. Плеханова.

ФизТех

# воровство

# крестьяне

# лошади

# Россия

8 июля, 09:23

Полина Меньшова

Люди с высоким уровнем интеллекта оказались менее нравственными

Принято считать, что люди с развитыми когнитивными способностями отличаются высокими моральными принципами. Ученые из Великобритании решили проверить этот тезис научными методами и пришли к противоположному выводу.

Психология

# интеллект

# мораль

# нравственность

# показатель IQ

9 июля, 08:26

Полина Меньшова

Предпочтения в спорте связали с типом личности

Психология

# спорт

# тип личности

# фитнес

# характер

# черты личности

9 июля, 12:05

Редакция Naked Science

За месяц «ВКонтакте» покинули больше миллиона авторов

В июне 2025 года ВК покинули 1,2 миллиона авторов контента. Это резкое ускорение их бегства в сравнении с предшествующими месяцами. Одновременно число авторов на других платформах растет, в результате по этому показателю соцсеть обогнал не только Telegram, но и запрещенный Instagram*. Причиной происходящего многие наблюдатели посчитали совокупность решений менеджмента компании за последние годы.

Медиа

# «ВКонтакте»

# медиа

# соцсети

17 июня, 16:49

Адель Романова

Давно отключенный спутник внезапно прислал «громкий» радиосигнал

Радиотелескопы уловили очень короткий сигнал, и по его характеристикам стало ясно, что он не может быть естественного происхождения. Астрономы пришли к выводу, что источник находился в околоземном пространстве — там, где уже более полувека летает «мертвый» аппарат NASA.

Астрономия

# космический мусор

# космос

# радиосигналы

# спутники

25 июня, 15:19

ФизТех

Российские ученые впервые точно определили источники шума сверхзвукового самолета с помощью суперкомпьютера

Группа российских ученых из Института прикладной математики имени М. В. Келдыша РАН и МФТИ провела детальное численное исследование источников шума, генерируемых крылом прототипа сверхзвукового бизнес-джета в режиме посадки. Эта работа, сочетающая передовые методы вычислительной гидродинамики и аэроакустики, впервые позволила с высокой точностью локализовать и охарактеризовать основные зоны шумообразования вблизи полноразмерной геометрии крыла модели прототипа сверхзвукового пассажирского самолета в посадочной конфигурации.

ФизТех

# «Суперджет»

# самолет

# сверхзвуковой

# суперкомпьютеры

# Шум

2 июля, 11:17

Юлия Тарасова

Коров покормили отходами конопли и проверили их молоко на психоактивность

Результаты эксперимента в США в будущем могут позволить добиться разрешения на использование отработанной конопли в качестве кормовой добавки в животноводстве.

Биология

# животноводство

# конопля

# корм

# коровы

# молоко

# ТГК

# тетрагидроканнабинол

[miniorange_social_login]

Материалы Сколтеха комментировать нельзя?!.. Всяко, мне это уже дважды не удалось...Вот сейчас попробовал, опять новый комментарий не появился. Сейчас проверю, можно ли критиковать, отредактировав уже прошедшую реплику?..Читаешь вот такое -- "для аугментации текстовых данных" -- и невольно вспоминаешь профессора Преображенского: "Потрудитесь излагать ваши мысли яснее..." Даже слазив в интернет не нашел значения слова "аугментация", применимого к машинному лингвистическому анализу текстов, а только к музыке, стоматологии и компьютерным играм... Друг наш, Сколтех, об одном тебя прошу: не говори красиво... А если уж говоришь, то сказанное сложно поясняй простыми словами...

Ответить

Лев Григорьев

13.05.2021

Ответить

Нейронные языковые модели расширили освоение человеческой речи

По теме

Ученые: человечество спаслось от вирусов, перестав кусаться

Оговорочка по Фрейду

Звуковая карта мозга поможет прочесть мысли

Популярное

Предпочтения в спорте связали с типом личности

Ученые определили оптимальную длительность физической активности, которая продлевает жизнь на треть

Скрутить в кольцо и сломать позвоночник: ученые узнали, как крестьяне наказывали конокрадов в царской России

Люди с высоким уровнем интеллекта оказались менее нравственными

Предпочтения в спорте связали с типом личности

За месяц «ВКонтакте» покинули больше миллиона авторов

Давно отключенный спутник внезапно прислал «громкий» радиосигнал

Российские ученые впервые точно определили источники шума сверхзвукового самолета с помощью суперкомпьютера

Коров покормили отходами конопли и проверили их молоко на психоактивность

Комментарии

Хотите
вести колонку
в нашем
издании?

Колумнисты 64

ПНИПУ

ФизТех

Сколтех

НИУ ВШЭ

ТюмГУ

РНФ

ЮФУ

МГППУ

НИТУ МИСИС

КНЦ РАН

Глобальное потепление убивает — если смотреть на него, прикрыв один глаз

Ветряки растут в сторону проектов сталинских времен: хорошо это или плохо?

27 месяцев надежды

Ковид в Армении пошел на спад — не потому, что власти с ним справились, а потому, что не справились

Семерка самых значимых и необычных событий в науке и технике 2021 года

10 самых необычных грибов

Свет иных миров: как превратить темную материю, галактики, черные дыры и даже Солнце в линзы супертелескопа

Денисовский человек оказался вчетверо старше

Нейронные языковые модели расширили освоение человеческой речи

По теме

Ученые: человечество спаслось от вирусов, перестав кусаться

Оговорочка по Фрейду

Звуковая карта мозга поможет прочесть мысли

Популярное

Комментарии

Хотите вести колонку в нашем издании?

Колумнисты 64

ПНИПУ

ФизТех

Сколтех

НИУ ВШЭ

ТюмГУ

РНФ

ЮФУ

МГППУ

НИТУ МИСИС

КНЦ РАН

Хотите
вести колонку
в нашем
издании?