• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
23.11.2023, 10:43
ТюмГУ
148

В ТюмГУ предложили вариант извлечения ключевых фраз из текста

❋ 4.3

Список ключевых фраз — важный атрибут научного текста. Такие фразы включают краткое его содержание и помогают поисковым системам находить и систематизировать статьи. Качественный подбор ключевых фраз положительно влияет на видимость текста и его цитируемость. Многие из нынешних подходов к извлечению ключевых фраз включают выбор слов из исходной статьи, ранжирование кандидатов, но этого часто недостаточно для качественного поиска. Специалисты ТюмГУ заполнили пробел в исследованиях путем систематической оценки моделей абстрактного суммирования текста на основе преобразователей по нескольким критериям извлечения ключевых фраз.

Журналы
В ТюмГУ предложили вариант извлечения ключевых фраз из текста / © Getty images / Автор: Александр Литвинов

Статья «Применение суммирования текста на основе преобразователя для генерации ключевых фраз» ученых кафедры программного обеспечения ИМиКТ ТюмГУ Анны Глазковой и Дмитрия Морозова вышла в журнале «Лобачевский математический журнал».

На сегодня лишь немногие исследования изучали генерацию ключевых слов с использованием обобщения текста. Однако производительность современных моделей, основанных на архитектуре трансформатора, не была тщательно изучена для задачи извлечения ключевой фразы. Более того, не проводилось исследований, сравнивающих эффективность различных стратегий упорядочивания целевых ключевых фраз.

В своей статье ученые попытались заполнить пробел в исследованиях путем систематической оценки моделей абстрактного суммирования текста на основе преобразователей по нескольким критериям извлечения ключевых фраз.

Таким образом, ученые исследовали эффективность абстрактных моделей реферирования, основанных на архитектуре преобразователя, для задачи прогнозирования ключевых фраз для научных текстов. Команда ученых провела обширную оценку неконтролируемых и контролируемых моделей извлечения ключевых фраз и сравнила несколько стратегий упорядочивания для объединения ключевых фраз в нескольких наборах данных. 

Результаты показали некоторые плюсы и минусы использования моделей суммирования на основе трансформаторов для извлечения ключевых фраз. Во-первых, получены многообещающие результаты с точки зрения полного соответствия F1-оценки и BERTScore, но ROUGE-1 указывает на превосходство традиционных методов извлечения ключевых фраз. 

Во-вторых, исследователи указали, что модели реферирования более конкурентоспособны в генерировании ключевых фраз, которые явно не представлены в исходном тексте. Наконец, они продемонстрировали, что некоторые стратегии упорядочивания обеспечивают лучшие результаты при генерации ключевых фраз, тогда как другие снижают производительность.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Тюменский государственный университет (ТюмГУ) — первый университет Тюменской области, был открыт в 1930 году. Готовит специалистов по 175 направлениям подготовки. Университет является участником федеральной программы стратегического академического лидерства «Приоритет 2030». Участие в программе способствует трансформации образовательного, научно-технологического и управленческого блоков ТюмГУ, а также его роли в качестве центра научно-технологического и социально-экономического развития региона.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
13 октября, 11:10
Илья Гриднев

Согласно новой гипотезе, сознание возникает не только из-за активности нейронов, но и благодаря физическим процессам — электромагнитным полям от движения жидкости в мозге. Эта модель, как и ее предшественники, пока носит теоретический характер, но предлагает нестандартный взгляд на проблему синхронизации работы разных отделов мозга.

15 октября, 15:34
Адель Романова

Еще до официального открытия объект 3I/ATLAS попадал в поле зрения обсерваторий, и недавно эту межзвездную комету рассмотрели на архивных изображениях с космического телескопа TESS. На этих снимках у нее не оказалось комы. Тем не менее астрономы уверены, что комета должна была быть активной уже тогда.

13 октября, 19:23
Адель Романова

Недавно опубликованный план терраформирования Красной планеты предусматривает насыщение ее воздуха кислородом на 99%. При этом атмосферное давление должно будет стать примерно таким, как на высоте около 13-14 километров над Землей. Специалисты считают, что в такой среде можно дышать. Более того, у них есть конкретный план по достижению этой цели.

13 октября, 11:10
Илья Гриднев

Согласно новой гипотезе, сознание возникает не только из-за активности нейронов, но и благодаря физическим процессам — электромагнитным полям от движения жидкости в мозге. Эта модель, как и ее предшественники, пока носит теоретический характер, но предлагает нестандартный взгляд на проблему синхронизации работы разных отделов мозга.

13 октября, 19:23
Адель Романова

Недавно опубликованный план терраформирования Красной планеты предусматривает насыщение ее воздуха кислородом на 99%. При этом атмосферное давление должно будет стать примерно таким, как на высоте около 13-14 километров над Землей. Специалисты считают, что в такой среде можно дышать. Более того, у них есть конкретный план по достижению этой цели.

10 октября, 11:23
МГППУ

Креативность чаще всего ассоциируется с творчеством и искусством. Однако не всегда креатив направлен на благо. Например, схемы мошенников тоже можно назвать креативными, хотя они служат обману и личной выгоде. Такое «творчество» называют антисоциальным. К нему также относятся склонность ко лжи, оригинальной мести, злобным шуткам и розыгрышам, мошенничеству, дезинформации, политическим манипуляциям, слухам и домыслам. Психологи МГППУ рассмотрели особенности восприятия и понимания информации у людей с высокой антисоциальной креативностью и сравнили с характеристиками тех, кто обладает положительными чертами личности, в частности чертами Светлой триады — согласия, прощения и доброжелательности.

20 сентября, 08:52
Александр Березин

Посадка, включая выгорание куска степи, прошла штатно, но часть грызунов на борту погибли. Правда, погубила их не повышенная космическая радиация полярной орбиты, влияние которой на млекопитающих планировали выявить в миссии, а более банальные причины.

26 сентября, 11:41
ИИМК РАН

Археологи Института истории материальной культуры РАН (ИИМК РАН), при поддержке фонда «История отечества» в ходе раскопок обнаружили на всемирно известной стоянке каменного века Костенки-17 в Воронежской области редчайшие украшения из зубов песца и окаменелой раковины, а также уникальный для этого времени нуклеус из бивня мамонта для снятия заготовок.

13 октября, 11:10
Илья Гриднев

Согласно новой гипотезе, сознание возникает не только из-за активности нейронов, но и благодаря физическим процессам — электромагнитным полям от движения жидкости в мозге. Эта модель, как и ее предшественники, пока носит теоретический характер, но предлагает нестандартный взгляд на проблему синхронизации работы разных отделов мозга.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно