• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
23.11.2023
ТюмГУ
138

В ТюмГУ предложили вариант извлечения ключевых фраз из текста

4.3

Список ключевых фраз — важный атрибут научного текста. Такие фразы включают краткое его содержание и помогают поисковым системам находить и систематизировать статьи. Качественный подбор ключевых фраз положительно влияет на видимость текста и его цитируемость. Многие из нынешних подходов к извлечению ключевых фраз включают выбор слов из исходной статьи, ранжирование кандидатов, но этого часто недостаточно для качественного поиска. Специалисты ТюмГУ заполнили пробел в исследованиях путем систематической оценки моделей абстрактного суммирования текста на основе преобразователей по нескольким критериям извлечения ключевых фраз.

Журналы
В ТюмГУ предложили вариант извлечения ключевых фраз из текста / © Getty images / Автор: Александр Литвинов

Статья «Применение суммирования текста на основе преобразователя для генерации ключевых фраз» ученых кафедры программного обеспечения ИМиКТ ТюмГУ Анны Глазковой и Дмитрия Морозова вышла в журнале «Лобачевский математический журнал».

На сегодня лишь немногие исследования изучали генерацию ключевых слов с использованием обобщения текста. Однако производительность современных моделей, основанных на архитектуре трансформатора, не была тщательно изучена для задачи извлечения ключевой фразы. Более того, не проводилось исследований, сравнивающих эффективность различных стратегий упорядочивания целевых ключевых фраз.

В своей статье ученые попытались заполнить пробел в исследованиях путем систематической оценки моделей абстрактного суммирования текста на основе преобразователей по нескольким критериям извлечения ключевых фраз.

Таким образом, ученые исследовали эффективность абстрактных моделей реферирования, основанных на архитектуре преобразователя, для задачи прогнозирования ключевых фраз для научных текстов. Команда ученых провела обширную оценку неконтролируемых и контролируемых моделей извлечения ключевых фраз и сравнила несколько стратегий упорядочивания для объединения ключевых фраз в нескольких наборах данных. 

Результаты показали некоторые плюсы и минусы использования моделей суммирования на основе трансформаторов для извлечения ключевых фраз. Во-первых, получены многообещающие результаты с точки зрения полного соответствия F1-оценки и BERTScore, но ROUGE-1 указывает на превосходство традиционных методов извлечения ключевых фраз. 

Во-вторых, исследователи указали, что модели реферирования более конкурентоспособны в генерировании ключевых фраз, которые явно не представлены в исходном тексте. Наконец, они продемонстрировали, что некоторые стратегии упорядочивания обеспечивают лучшие результаты при генерации ключевых фраз, тогда как другие снижают производительность.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Тюменский государственный университет (ТюмГУ) — первый университет Тюменской области, был открыт в 1930 году. Готовит специалистов по 175 направлениям подготовки. Университет входит в число участников Проекта 5-100 — программы повышения международной конкурентоспособности российских вузов среди ведущих мировых научно-образовательных центров.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
12 февраля
Елизавета Александрова

Пролетевший через Солнечную систему в 2017 году астероид Оумуамуа произвел неизгладимое впечатление в том числе своей беспрецедентно вытянутой формой. Астрономы попытались рассчитать, как он мог стать таким и почему в Солнечной системе мы не наблюдаем ничего подобного.

Позавчера, 14:42
Елизавета Александрова

Астрономы рассчитали, сколько небесных тел могло прилететь в Солнечную систему от соседних звезд, расположенных в четырех световых годах от нас. Выяснилось, что такие объекты не только должны навещать нас, но и, вероятно, присоединяются ко множеству наших «местных» комет и астероидов. По расчетам, вокруг Солнца может обращаться около миллиона довольно крупных объектов из системы Альфы Центавра.

Вчера, 11:51
Елизавета Александрова

В космосе находят крупные миры, целиком покрытые океанами, и как минимум одна из них внушает подозрения насчет фитопланктона. Недавно ученые рассчитали, с какой скоростью на таких планетах могла бы развиваться жизнь.

12 февраля
Елизавета Александрова

Пролетевший через Солнечную систему в 2017 году астероид Оумуамуа произвел неизгладимое впечатление в том числе своей беспрецедентно вытянутой формой. Астрономы попытались рассчитать, как он мог стать таким и почему в Солнечной системе мы не наблюдаем ничего подобного.

10 февраля
Андрей

Европейские палеонтологи изучили исключительно сохранившийся скелет плезиозавра из юрского периода, обнаруженный в Германии еще в 1940 году. Тогда ископаемую рептилию спрятали от разрушений войны в музей, а через 80 лет выяснилось, что на теле древнего животного остались мягкие ткани — кожа с уцелевшими клеточными ядрами и чешуйки. Новые данные дополняют представление о внешнем виде плезиозавров, живших больше 180 миллионов лет назад.

10 февраля
Елизавета Александрова

Астрономы обнаружили, что почти треть всех наблюдаемых галактик во Вселенной объединены в пять самых широкомасштабных структур — галактические сверхскопления. На составленной учеными трехмерной карте одно особенно выделяется своими рекордными размерами: простирается на миллиард с лишним световых лет.

31 января
Березин Александр

В 2022-2025 годах страны Западной Европы попытались отказаться от природного газа из России. Автор новой работы показал, что получившиеся при этом результаты были во многом противоположны целям.

12 февраля
Елизавета Александрова

Пролетевший через Солнечную систему в 2017 году астероид Оумуамуа произвел неизгладимое впечатление в том числе своей беспрецедентно вытянутой формой. Астрономы попытались рассчитать, как он мог стать таким и почему в Солнечной системе мы не наблюдаем ничего подобного.

10 февраля
Андрей

Европейские палеонтологи изучили исключительно сохранившийся скелет плезиозавра из юрского периода, обнаруженный в Германии еще в 1940 году. Тогда ископаемую рептилию спрятали от разрушений войны в музей, а через 80 лет выяснилось, что на теле древнего животного остались мягкие ткани — кожа с уцелевшими клеточными ядрами и чешуйки. Новые данные дополняют представление о внешнем виде плезиозавров, живших больше 180 миллионов лет назад.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно