В ТюмГУ предложили вариант извлечения ключевых фраз из текста
Список ключевых фраз — важный атрибут научного текста. Такие фразы включают краткое его содержание и помогают поисковым системам находить и систематизировать статьи. Качественный подбор ключевых фраз положительно влияет на видимость текста и его цитируемость. Многие из нынешних подходов к извлечению ключевых фраз включают выбор слов из исходной статьи, ранжирование кандидатов, но этого часто недостаточно для качественного поиска. Специалисты ТюмГУ заполнили пробел в исследованиях путем систематической оценки моделей абстрактного суммирования текста на основе преобразователей по нескольким критериям извлечения ключевых фраз.
Статья «Применение суммирования текста на основе преобразователя для генерации ключевых фраз» ученых кафедры программного обеспечения ИМиКТ ТюмГУ Анны Глазковой и Дмитрия Морозова вышла в журнале «Лобачевский математический журнал».
На сегодня лишь немногие исследования изучали генерацию ключевых слов с использованием обобщения текста. Однако производительность современных моделей, основанных на архитектуре трансформатора, не была тщательно изучена для задачи извлечения ключевой фразы. Более того, не проводилось исследований, сравнивающих эффективность различных стратегий упорядочивания целевых ключевых фраз.
В своей статье ученые попытались заполнить пробел в исследованиях путем систематической оценки моделей абстрактного суммирования текста на основе преобразователей по нескольким критериям извлечения ключевых фраз.
Таким образом, ученые исследовали эффективность абстрактных моделей реферирования, основанных на архитектуре преобразователя, для задачи прогнозирования ключевых фраз для научных текстов. Команда ученых провела обширную оценку неконтролируемых и контролируемых моделей извлечения ключевых фраз и сравнила несколько стратегий упорядочивания для объединения ключевых фраз в нескольких наборах данных.
Результаты показали некоторые плюсы и минусы использования моделей суммирования на основе трансформаторов для извлечения ключевых фраз. Во-первых, получены многообещающие результаты с точки зрения полного соответствия F1-оценки и BERTScore, но ROUGE-1 указывает на превосходство традиционных методов извлечения ключевых фраз.
Во-вторых, исследователи указали, что модели реферирования более конкурентоспособны в генерировании ключевых фраз, которые явно не представлены в исходном тексте. Наконец, они продемонстрировали, что некоторые стратегии упорядочивания обеспечивают лучшие результаты при генерации ключевых фраз, тогда как другие снижают производительность.
Группа физиков-теоретиков из Международного центра теоретической физики имени А. А. Абрикосова МФТИ с коллегами разработала теорию оптической памяти на основе особого типа лазеров — поляритонных. Они показали, что такая система способна «запомнить» поляризацию, записанную одним фотоном, и удерживать ее в течение наносекунд.
В Университете МИСИС усовершенствовали технологию нанесения защитных электропроводящих покрытий на медные изделия, широко используемые в качестве элементов скользящих электроконтактов, например, в токосъемниках. Метод увеличивает прочность соединения покрытий с подложкой на 17%.
Ученые нашли признак, который позволяет точно оценить пластичность органических кристаллов, востребованных в устройствах гибкой электроники и робототехнике. Ранее считалось, что хорошо гнутся материалы со слоистой структурой, где молекулы внутри слоя связаны крепко, а между слоями — слабо. Оказалось, что этих требований недостаточно и важно учитывать также энергию, которую нужно затратить на то, чтобы сдвинуть слои друг относительно друга — чем она ниже, тем материал более гибкий. Открытие упростит проектирование и создание органических кристаллов с заданными свойствами.
Генетика интеллекта сложна и связана с разными психоневрологическими состояниями. Оказалось, то, что повышает эрудицию, может ухудшать способность решать творческие задачи, — и наоборот. Причем паттерны этих связей уникальны для каждого диагноза.
Полифенолы и другие соединения заваренного кофе в лабораторной модели связывались с ядерным рецептором NR4A1, который участвует в ответе клеток на стресс, воспаление и повреждение. Вещества меняли активность рецептора и тормозили рост опухолевых клеток, а при подавлении рецептора эффект слабел. Ученые предложили молекулярное объяснение части полезных эффектов кофе, но не проверяли их у людей.
Метеорный поток Эта-Аквариды достигнет своего максимума в ночь с 5 на 6 мая. Его частицы — осколки самой знаменитой кометы в истории, которая появляется над Землей раз в 76 лет. Ученый Пермского Политеха рассказал, как этот звездопад связан с кометой Галлея, почему у него есть «брат-близнец» и где лучше всего за ним наблюдать.
В последнее время пуски с российских северных космодромов осуществляют без предварительного уведомления, чего не было в прошлом. Вероятно, дело в недавно упомянутых главой «Роскосмоса» атаках на Плесецк во время пуска. Сегодняшний запуск обеспечил вывод на орбиту космических аппаратов военного назначения.
Когда международная экспедиционная группа, исследующая море Уэдделла в Антарктиде на борту ледокола «Поларштерн», попыталась укрыться от шторма, ученые и экипаж судна удивились внезапному появлению острова, не обозначенного ни на одной морской карте.
Химические связи в материале, из которого сделана электроника, разрываются не из-за накопительного износа от протекания тока через них, а из-за электронов с конкретной энергией.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
