• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
2 часа назад
НИЦ «Курчатовский институт»
73

Разработан алгоритм поиска научных статей с помощью нейросети

4.4

Специалисты НИЦ «Курчатовский институт» и МФТИ разработали систему семантического поиска научных публикаций по большим базам научных публикаций на основе информации о внешнем цитировании с использованием нейросетевых моделей.

Разработан алгоритм поиска научных публикаций с помощью нейросети / © patrick tomasso, unsplash

Современные темпы роста объема научной информации требуют новых инструментов, позволяющих ученым искать и отбирать публикации на интересующие их темы.

Современные цифровые методы поиска научных статей включают в себя не только текстовые запросы и анализ цитирований, но и более сложные алгоритмы. Например, популярные системы Google Scholar и Scopus при ранжировании статей учитывают как ключевые слова, так и данные о цитированиях одних статей другими, что помогает найти наиболее релевантные материалы. Системы СoCites и Connected Papers умеют анализировать частоту, с которой статьи цитируют друг друга: это позволяет лучше выделять темы, идеи и концепции, наиболее актуальные для конкретной научной области.

Для улучшения точности поиска ученые постоянно ищут новые методы. Результаты работы опубликованы в научном журнале «Физика элементарных частиц и атомного ядра».

«Существующие сегодня методы поиска учитывают лишь частоту совместного цитирования. Разработанная нами система предлагает новый подход к поиску по научным публикациям — на основе кратких описаний результатов работ, используемых при цитировании одних статей другими. При обучении нейросетевой модели мы использовали базу англоязычных научных публикаций по биомедицине PubMed Central объемом 7,6 миллиона статей», — сообщила Дарья Доровских, лаборант-исследователь Курчатовского комплекса НБИКС-природоподобных технологий.

Из архива публикаций отбиралась информация о цитировании: текст авторского упоминания ключевых результатов другой работы и ссылка на нее. Затем с помощью нейросетевой модели BERT были созданы векторные представления этих упоминаний. Векторные представления позволяют хранить семантику слов в понятном для компьютера виде: векторы фиксируют информацию о значении слова на основе соседних слов в тексте.

Созданный прототип сервиса определяет семантический контекст и позволяет находить научные публикации по коротким описаниям. В том числе система может быстро найти статьи, даже если они не полностью соответствуют ключевым словам поискового запроса, но релевантны ему по теме.

Для удобства пользователей специалисты разработали веб-интерфейс на основе Python с использованием библиотек Flask и React для поиска статей. Систему протестировали на различных запросах, одни из которых составлялись вручную, другие автоматически выбирались из текста статей. Результаты показали, что новая система на основе нейросетевой модели BERT более точна, чем традиционные методы: она находит релевантные статьи быстрее и эффективнее. По словам ученых, прототип системы можно доработать с учетом особенностей сферы внедрения.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Национальный исследовательский центр «Курчатовский институт» – одно из крупнейших научных учреждений России. Основанный в 1943 году для создания советского атомного проекта, он стал родоначальником множества новых технологий и научных направлений. Сегодня «Курчатовский институт» – мультидисциплинарный центр с широкими научными интересами и уникальной технической исследовательской базой.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Позавчера, 11:32
Алиса Гаджиева

Полторы тысячи лет назад климат в Северном полушарии резко изменился. В Дании так похолодало, что там стало невозможно заниматься сельским хозяйством. Авторы нового исследования считают, что именно этот период был прообразом Фимбульвинтера — зимы, предшествующей Рагнарёку.

Вчера, 03:01
Татьяна

Сейчас Япония привлекает людей со всего мира, но так было не всегда. На протяжение десяти тысяч лет архипелаг оставался изолированным от остального мира, пока туда не начали прибывать первые «мигранты» с континента. Это показал генетический анализ останков человека эпохи Яёй.

Вчера, 11:39
МАИ

В России стремительно, опережая все прогнозируемые темпы, развивается сфера пассажирских авиаперевозок. Об этом заявил премьер-министр страны Михаил Мишустин на встрече с генеральным директором «Аэрофлота» Сергеем Александровским. Сегодня у российских специалистов есть целый ряд проектов, направленных на развитие отрасли. В частности, большое внимание уделяется развитию сверхзвукового авиатранспорта. Но когда его введут в эксплуатацию и насколько это безопасно? Ответы на животрепещущие вопросы дал доцент кафедры «Аэродинамика, динамика и управление летательных аппаратов» МАИ Михаил Тяглик.

Позавчера, 11:32
Алиса Гаджиева

Полторы тысячи лет назад климат в Северном полушарии резко изменился. В Дании так похолодало, что там стало невозможно заниматься сельским хозяйством. Авторы нового исследования считают, что именно этот период был прообразом Фимбульвинтера — зимы, предшествующей Рагнарёку.

Вчера, 03:01
Татьяна

Сейчас Япония привлекает людей со всего мира, но так было не всегда. На протяжение десяти тысяч лет архипелаг оставался изолированным от остального мира, пока туда не начали прибывать первые «мигранты» с континента. Это показал генетический анализ останков человека эпохи Яёй.

11 октября
Татьяна

В 1898 году два льва терроризировали лагерь строителей моста через реку Цаво в Кении. Хищники наведывались ночами и похищали людей из палаток. Погибли 28 человек. Людоедов застрелил британский военный Джон Генри Паттерсон, позже он передал останки в Музей естественной истории имени Филда в Чикаго. Ученые из США и Кении исследовали черепа хищников, извлекли ДНК из сохранившихся в зубах волосков и выяснили видовую принадлежность жертв.

Позавчера, 11:32
Алиса Гаджиева

Полторы тысячи лет назад климат в Северном полушарии резко изменился. В Дании так похолодало, что там стало невозможно заниматься сельским хозяйством. Авторы нового исследования считают, что именно этот период был прообразом Фимбульвинтера — зимы, предшествующей Рагнарёку.

25 сентября
Татьяна

Марс не всегда был холодным и сухим, как сейчас. Все больше фактов говорит о том, что миллиарды лет назад там текли водные потоки. А значит, была плотная атмосфера, создающая парниковый эффект и поддерживающая воду в жидком состоянии. Примерно 3,5 миллиарда лет назад вода исчезла, газовая оболочка существенно поредела. Почему? Ответ буквально лежит на поверхности, выяснили американские геологи.

17 сентября
Unitsky String Technologies Inc.

Инженеры из Белоруссии разработали альтернативный маршрут для более быстрой, безопасной и доступной перевозки грузов по сравнению с использованием Северного морского пути (СМП). Проект предусматривает организацию высокоскоростных грузопассажирских перевозок, в том числе транзитных, что станет альтернативой другим видам транспорта, в первую очередь авиации, за счет высокой скорости передвижения и уровня комфорта.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно