В ТюмГУ предложили вариант извлечения ключевых фраз из текста
Список ключевых фраз — важный атрибут научного текста. Такие фразы включают краткое его содержание и помогают поисковым системам находить и систематизировать статьи. Качественный подбор ключевых фраз положительно влияет на видимость текста и его цитируемость. Многие из нынешних подходов к извлечению ключевых фраз включают выбор слов из исходной статьи, ранжирование кандидатов, но этого часто недостаточно для качественного поиска. Специалисты ТюмГУ заполнили пробел в исследованиях путем систематической оценки моделей абстрактного суммирования текста на основе преобразователей по нескольким критериям извлечения ключевых фраз.
Статья «Применение суммирования текста на основе преобразователя для генерации ключевых фраз» ученых кафедры программного обеспечения ИМиКТ ТюмГУ Анны Глазковой и Дмитрия Морозова вышла в журнале «Лобачевский математический журнал».
На сегодня лишь немногие исследования изучали генерацию ключевых слов с использованием обобщения текста. Однако производительность современных моделей, основанных на архитектуре трансформатора, не была тщательно изучена для задачи извлечения ключевой фразы. Более того, не проводилось исследований, сравнивающих эффективность различных стратегий упорядочивания целевых ключевых фраз.
В своей статье ученые попытались заполнить пробел в исследованиях путем систематической оценки моделей абстрактного суммирования текста на основе преобразователей по нескольким критериям извлечения ключевых фраз.
Таким образом, ученые исследовали эффективность абстрактных моделей реферирования, основанных на архитектуре преобразователя, для задачи прогнозирования ключевых фраз для научных текстов. Команда ученых провела обширную оценку неконтролируемых и контролируемых моделей извлечения ключевых фраз и сравнила несколько стратегий упорядочивания для объединения ключевых фраз в нескольких наборах данных.
Результаты показали некоторые плюсы и минусы использования моделей суммирования на основе трансформаторов для извлечения ключевых фраз. Во-первых, получены многообещающие результаты с точки зрения полного соответствия F1-оценки и BERTScore, но ROUGE-1 указывает на превосходство традиционных методов извлечения ключевых фраз.
Во-вторых, исследователи указали, что модели реферирования более конкурентоспособны в генерировании ключевых фраз, которые явно не представлены в исходном тексте. Наконец, они продемонстрировали, что некоторые стратегии упорядочивания обеспечивают лучшие результаты при генерации ключевых фраз, тогда как другие снижают производительность.
Физикам долго не удавалось применить фазовый контраст в электронной микроскопии. Оказалось, что нужно было прекратить искать подходящее вещество для фазовой пластины и обратить внимание на лазеры.
Сам факт того, что после распада Западной Римской империи возникали новые государства, историкам известен давно. Нет сомнений в существовании королевств готов, франков, лангобардов и других постримских политических образований. Авторы нового исследования сосредоточились на более сложном вопросе. Они попытались выяснить, как именно происходило формирование таких обществ на уровне отдельных людей, семей и общин. Впервые благодаря сочетанию генетических и археологических данных исследователи смогли реконструировать развитие одного постримского политического общества, которое располагалось на территории Паннонии.
Ученые с высокой точностью измерили ключевые параметры нейтринных осцилляций — угол смешивания θ₁₂ и разность квадратов масс нейтрино. Результаты верифицировали несколькими методами.
Старший преподаватель кафедры физики и технической механики РТУ МИРЭА Николай Зенченко проанализировал принципы работы одежды с маркировкой UPF — технологии, которая блокирует до 98% ультрафиолетового излучения. В отличие от солнцезащитного крема, такая защита не смывается водой и действует весь день, но при этом требует правильного выбора материала. Эксперт развеял популярные мифы: почему мокрая хлопковая футболка не спасает от ожогов, можно ли загореть в UPF-купальнике и зачем горнолыжной куртке защита от солнца.
Американские биотехнологи впервые сообщили об обращении вспять клеточного старения в живых клетках печени человека — не мышиных, не синтетических, а именно человеческих. На волне этого результата компания привлекла 435 миллионов долларов и готовится к клиническим испытаниям.
Недавняя модификация ускорителя частиц позволила провести измерения, о которых теоретики рассуждали более 50 лет.
Хотя длительность помех не превышала десяти секунд, это первый известный случай такого рода. Обычно спутникам не хватает мощности для создания радиосигналов той силы, что нужна для подобных помех.
В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.
В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
