• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
23.11.2023, 10:43
ТюмГУ
140

В ТюмГУ предложили вариант извлечения ключевых фраз из текста

❋ 4.3

Список ключевых фраз — важный атрибут научного текста. Такие фразы включают краткое его содержание и помогают поисковым системам находить и систематизировать статьи. Качественный подбор ключевых фраз положительно влияет на видимость текста и его цитируемость. Многие из нынешних подходов к извлечению ключевых фраз включают выбор слов из исходной статьи, ранжирование кандидатов, но этого часто недостаточно для качественного поиска. Специалисты ТюмГУ заполнили пробел в исследованиях путем систематической оценки моделей абстрактного суммирования текста на основе преобразователей по нескольким критериям извлечения ключевых фраз.

Журналы
В ТюмГУ предложили вариант извлечения ключевых фраз из текста / © Getty images / Автор: Александр Литвинов

Статья «Применение суммирования текста на основе преобразователя для генерации ключевых фраз» ученых кафедры программного обеспечения ИМиКТ ТюмГУ Анны Глазковой и Дмитрия Морозова вышла в журнале «Лобачевский математический журнал».

На сегодня лишь немногие исследования изучали генерацию ключевых слов с использованием обобщения текста. Однако производительность современных моделей, основанных на архитектуре трансформатора, не была тщательно изучена для задачи извлечения ключевой фразы. Более того, не проводилось исследований, сравнивающих эффективность различных стратегий упорядочивания целевых ключевых фраз.

В своей статье ученые попытались заполнить пробел в исследованиях путем систематической оценки моделей абстрактного суммирования текста на основе преобразователей по нескольким критериям извлечения ключевых фраз.

Таким образом, ученые исследовали эффективность абстрактных моделей реферирования, основанных на архитектуре преобразователя, для задачи прогнозирования ключевых фраз для научных текстов. Команда ученых провела обширную оценку неконтролируемых и контролируемых моделей извлечения ключевых фраз и сравнила несколько стратегий упорядочивания для объединения ключевых фраз в нескольких наборах данных. 

Результаты показали некоторые плюсы и минусы использования моделей суммирования на основе трансформаторов для извлечения ключевых фраз. Во-первых, получены многообещающие результаты с точки зрения полного соответствия F1-оценки и BERTScore, но ROUGE-1 указывает на превосходство традиционных методов извлечения ключевых фраз. 

Во-вторых, исследователи указали, что модели реферирования более конкурентоспособны в генерировании ключевых фраз, которые явно не представлены в исходном тексте. Наконец, они продемонстрировали, что некоторые стратегии упорядочивания обеспечивают лучшие результаты при генерации ключевых фраз, тогда как другие снижают производительность.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Тюменский государственный университет (ТюмГУ) — первый университет Тюменской области, был открыт в 1930 году. Готовит специалистов по 175 направлениям подготовки. Университет входит в число участников Проекта 5-100 — программы повышения международной конкурентоспособности российских вузов среди ведущих мировых научно-образовательных центров.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
21 августа, 14:41
Юлия Трепалина

В исследовании с участием более 8000 человек из США и семи азиатских стран ученые оценили, как стремление к политической онлайн-активности коррелирует с когнитивными способностями, выраженностью психопатических и нарциссических черт, а также страхом пропустить что-то важное.

22 августа, 13:09
Юлия Трепалина

Большие кошки (Pantherinae) обычно охотятся на животных своего или меньшего размера. У снежных барсов, как выяснилось, другие предпочтения. Новое исследование показало, что ирбисы чаще нападают на взрослых горных козлов, которые как минимум вдвое превосходят хищников в весе. Ученые объяснили, с чем может быть связан такой выбор добычи.

22 августа, 14:45
Игорь Байдов

Ученые обнаружили косвенные доказательства существования мира размером с Землю за орбитой Нептуна. Эта гипотетическая планета отличается от предполагаемой Девятой планеты не только размером, но и гравитационным влиянием на другие объекты.

16 августа, 19:09
Адель Романова

Астрономы подсчитали, что с поверхности летящего по Солнечной системе межзвездного объекта 3I/ATLAS каждую секунду испаряется около 40 килограммов водяного льда. Такую сильную кометную активность он проявил, будучи в три с половиной раза дальше Земли от Солнца. По мнению ученых, это довольно необычно.

19 августа, 15:54
Елена Авдеева

К любопытным выводам привели наблюдения японских ученых за пестролицыми буревестниками. Оказалось, эти птицы испражняются в основном на лету, намеренно избегая такой возможности на поверхности воды. Очевидно, предположили исследователи, это облегчает движения в воздухе взрослым особям с добычей во рту.

18 августа, 11:11
Денис Яковлев

За последнее десятилетие ученые создали несколько сложных систем «мозг — компьютер», которые позволяли преобразовывать мозговую активность людей, лишившихся способности говорить из-за различных заболеваний, в речь. Однако до сих пор удавалось расшифровать лишь небольшое количество слов. Теперь в США создали алгоритм, благодаря которому удалось распознать до 54 процентов «речи».

25 июля, 07:47
Адель Романова

Прибывшая из межзвездного пространства предполагаемая комета 3I/ATLAS движется по траектории, максимально удобной для гравитационных маневров управляемого корабля, при этом возможность ее отслеживания с Земли практически минимальна. По мнению некоторых ученых, такое «поведение» объекта наводит на определенные мысли.

6 августа, 20:59
Татьяна Пичугина

Примерно 12 800 лет назад в Северном полушарии началось резкое изменение климата, которое сопровождалось вымиранием мегафауны и угасанием культуры Кловис. Такое могло произойти, например, из-за прорыва пресных вод в Атлантику или мощного вулканического извержения. Несколько лет назад ученые обнаружили места на суше с повышенным содержанием элементов платиновой группы, прослоями угля, микрочастицами расплава. По их мнению, это может быть признаком пребывания Земли в потоке обломков кометы или астероида. В новой работе впервые представлены доказательства кометного события в позднем дриасе из морских осадочных толщ.

30 июля, 08:08
Редакция Naked Science

Возраст находок — около 5500 лет, они лежат во множестве круглых ям, чьи стены укреплены кирпичом. Среди обнаруженных орудий из кремня есть и сотни неиспользованных, которые могут быть ритуальным подношением богам.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно