Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Разработан алгоритм поиска научных статей с помощью нейросети
Специалисты НИЦ «Курчатовский институт» и МФТИ разработали систему семантического поиска научных публикаций по большим базам научных публикаций на основе информации о внешнем цитировании с использованием нейросетевых моделей.
Современные темпы роста объема научной информации требуют новых инструментов, позволяющих ученым искать и отбирать публикации на интересующие их темы.
Современные цифровые методы поиска научных статей включают в себя не только текстовые запросы и анализ цитирований, но и более сложные алгоритмы. Например, популярные системы Google Scholar и Scopus при ранжировании статей учитывают как ключевые слова, так и данные о цитированиях одних статей другими, что помогает найти наиболее релевантные материалы. Системы СoCites и Connected Papers умеют анализировать частоту, с которой статьи цитируют друг друга: это позволяет лучше выделять темы, идеи и концепции, наиболее актуальные для конкретной научной области.
Для улучшения точности поиска ученые постоянно ищут новые методы. Результаты работы опубликованы в научном журнале «Физика элементарных частиц и атомного ядра».
«Существующие сегодня методы поиска учитывают лишь частоту совместного цитирования. Разработанная нами система предлагает новый подход к поиску по научным публикациям — на основе кратких описаний результатов работ, используемых при цитировании одних статей другими. При обучении нейросетевой модели мы использовали базу англоязычных научных публикаций по биомедицине PubMed Central объемом 7,6 миллиона статей», — сообщила Дарья Доровских, лаборант-исследователь Курчатовского комплекса НБИКС-природоподобных технологий.
Из архива публикаций отбиралась информация о цитировании: текст авторского упоминания ключевых результатов другой работы и ссылка на нее. Затем с помощью нейросетевой модели BERT были созданы векторные представления этих упоминаний. Векторные представления позволяют хранить семантику слов в понятном для компьютера виде: векторы фиксируют информацию о значении слова на основе соседних слов в тексте.
Созданный прототип сервиса определяет семантический контекст и позволяет находить научные публикации по коротким описаниям. В том числе система может быстро найти статьи, даже если они не полностью соответствуют ключевым словам поискового запроса, но релевантны ему по теме.
Для удобства пользователей специалисты разработали веб-интерфейс на основе Python с использованием библиотек Flask и React для поиска статей. Систему протестировали на различных запросах, одни из которых составлялись вручную, другие автоматически выбирались из текста статей. Результаты показали, что новая система на основе нейросетевой модели BERT более точна, чем традиционные методы: она находит релевантные статьи быстрее и эффективнее. По словам ученых, прототип системы можно доработать с учетом особенностей сферы внедрения.
Международная команда палеонтологов описала новый вид динозавра размером с крупную современную птицу. Он носил на голове плотный костяной нарост, который эти животные, возможно, использовали для внутривидовых разборок. Находка показывает, что даже мелкие хищники мелового периода могли решать конфликты не только когтями и зубами, но и ударами головой.
Кэтлин Рубинс выступила перед комитетом Национальных академий США и рассказала, что не так с новыми скафандрами для близкой высадки американцев на Луне. Учитывая ее 300-дневный опыт пребывания в космосе, критика выглядит довольно обоснованной. В прошлом году Рубинс ушла с поста руководителя отделения внекорабельной деятельности отдела астронавтов, где она участвовала в разработке новых лунных скафандров.
Психологи установили, что люди продолжают доверять содержанию видеороликов, даже когда получают прямое уведомление об их поддельности. Маркировка контента снизила убедительность материалов лишь частично, но не устранила влияние дезинформации на суждения аудитории о происходящем на экране.
Образцы грунта, взятые астронавтами полвека назад, вложили еще один важный кирпич в здание научной картины мира: гипотеза о том, что Земля исходно была сухой, не стыкуется с фактами. Похоже, идею о невозможности сохранения большого количества воды на «теплых» планетах придется пересмотреть.
В зоопарках звери доживают до старости и выбывают из программ глобального сохранения видов, потому что не могут размножаться. Это ставит под угрозу усилия по поддержанию популяций редких видов.
Международная команда палеонтологов описала новый вид динозавра размером с крупную современную птицу. Он носил на голове плотный костяной нарост, который эти животные, возможно, использовали для внутривидовых разборок. Находка показывает, что даже мелкие хищники мелового периода могли решать конфликты не только когтями и зубами, но и ударами головой.
От рыб произошли все наземные позвоночные, включая нас, но как именно рыбы стали главным населением морей — до последнего времени оставалось неясным. Авторы новой научной работы попытались доказать, что причиной этого было вымирание, возможно, вызванное белыми ночами.
Образцы грунта, взятые астронавтами полвека назад, вложили еще один важный кирпич в здание научной картины мира: гипотеза о том, что Земля исходно была сухой, не стыкуется с фактами. Похоже, идею о невозможности сохранения большого количества воды на «теплых» планетах придется пересмотреть.
Хотя зоологи уже не раз наблюдали использование орудий у относительно близких к людям видов, — от приматов до свиней — коровы до сих пор не были за этим замечены. Теперь ситуация изменилась: оказалось, что они могут использовать многоцелевые орудия по-разному, в зависимости от обстоятельств.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
