Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Разработан алгоритм поиска научных статей с помощью нейросети
Специалисты НИЦ «Курчатовский институт» и МФТИ разработали систему семантического поиска научных публикаций по большим базам научных публикаций на основе информации о внешнем цитировании с использованием нейросетевых моделей.
Современные темпы роста объема научной информации требуют новых инструментов, позволяющих ученым искать и отбирать публикации на интересующие их темы.
Современные цифровые методы поиска научных статей включают в себя не только текстовые запросы и анализ цитирований, но и более сложные алгоритмы. Например, популярные системы Google Scholar и Scopus при ранжировании статей учитывают как ключевые слова, так и данные о цитированиях одних статей другими, что помогает найти наиболее релевантные материалы. Системы СoCites и Connected Papers умеют анализировать частоту, с которой статьи цитируют друг друга: это позволяет лучше выделять темы, идеи и концепции, наиболее актуальные для конкретной научной области.
Для улучшения точности поиска ученые постоянно ищут новые методы. Результаты работы опубликованы в научном журнале «Физика элементарных частиц и атомного ядра».
«Существующие сегодня методы поиска учитывают лишь частоту совместного цитирования. Разработанная нами система предлагает новый подход к поиску по научным публикациям — на основе кратких описаний результатов работ, используемых при цитировании одних статей другими. При обучении нейросетевой модели мы использовали базу англоязычных научных публикаций по биомедицине PubMed Central объемом 7,6 миллиона статей», — сообщила Дарья Доровских, лаборант-исследователь Курчатовского комплекса НБИКС-природоподобных технологий.
Из архива публикаций отбиралась информация о цитировании: текст авторского упоминания ключевых результатов другой работы и ссылка на нее. Затем с помощью нейросетевой модели BERT были созданы векторные представления этих упоминаний. Векторные представления позволяют хранить семантику слов в понятном для компьютера виде: векторы фиксируют информацию о значении слова на основе соседних слов в тексте.
Созданный прототип сервиса определяет семантический контекст и позволяет находить научные публикации по коротким описаниям. В том числе система может быстро найти статьи, даже если они не полностью соответствуют ключевым словам поискового запроса, но релевантны ему по теме.
Для удобства пользователей специалисты разработали веб-интерфейс на основе Python с использованием библиотек Flask и React для поиска статей. Систему протестировали на различных запросах, одни из которых составлялись вручную, другие автоматически выбирались из текста статей. Результаты показали, что новая система на основе нейросетевой модели BERT более точна, чем традиционные методы: она находит релевантные статьи быстрее и эффективнее. По словам ученых, прототип системы можно доработать с учетом особенностей сферы внедрения.
Наблюдая за сверхновой 2024 ggi спустя всего 26 часов после вспышки, астрономы напрямую определили форму ударной волны в момент ее прорыва из звезды. Открытие позволит уточнить механизмы гибели массивных светил и может привести к пересмотру существующих моделей возникновения сверхновых.
На уникальных древнеримских стеклянных сосудах обнаружили тайные знаки, которые оказались клеймами ремесленных мастерских. Эти символы, ранее считавшиеся простым украшением, раскрыли, как работали античные мастера, и помогли доказать существование аналогов современных брендов почти две тысячи лет назад.
Ученые из МФТИ и Национального исследовательского центра «Курчатовский институт» создали первую в своем роде полную классификацию конических сингулярностей в геометрии Минковского. Это фундаментальное достижение в математической физике заполняет пробел, существовавший в общей теории относительности более 60 лет.
Ученые открыли новый, ранее неизвестный способ передвижения бактерий по поверхностям, для которого не нужны жгутики. Эти микроорганизмы на краю колонии переваривают сахара, выделяют метаболиты и создают осмотическое давление. Оно вызывает микроскопическое «цунами», и на нем бактерии катятся вперед.
Недавно интернет взорвался заголовками: «Симуляция Вселенной невозможна», «Новое исследование полностью опровергает теорию симуляции». Поводом стала статья, авторы которой вознамерились доказать, что мы не живем внутри компьютера. Naked Science объясняет, что не так с этой новостью и можно ли на самом деле доказать, что «матрицы не существует».
Термояд начнет вырабатывать электричество через 20 лет — так говорили с 1950-х, но этого все так и не происходит. Почему? В чем принципиальные сложности на этом пути? Чего добивается «Росатом» в проекте ИТЭР и почему параллельно уже начал работу по российскому термоядерному реактору ТРТ? Руководитель проектного офиса по управляемому термоядерному синтезу «Наука и инновации» госкорпорации «Росатом» Андрей Аникеев ответил на наши вопросы.
Проанализировав данные наблюдений, полученных с помощью наземных обсерваторий за последние два десятилетия, астрономы обнаружили потенциально обитаемый мир — суперземлю Gliese 251 c (GJ 251 с). Планета обращается вокруг красного карлика на расстоянии около 18 световых лет от Земли и считается одним из самых перспективных кандидатов для поисков жизни.
По расчетам, большинство «гостей» из других звездных систем летят к Земле примерно со стороны созвездия Геркулес. Скорее всего, они время от времени падают на нашу планету, просто мы еще не научились это замечать. Как удалось вычислить, чаще всего они должны падать зимой и где-то в окрестностях экватора.
В современном доме, насыщенном разнообразной техникой, удлинители стали незаменимым атрибутом, позволяющим обеспечить электропитанием все необходимые устройства. Однако мало кто задумывается, что привычное использование этого аксессуара может нести серьезную угрозу безопасности. По статистике, значительная часть бытовых пожаров происходит из-за неправильной эксплуатации электропроводки и вспомогательных устройств. Какие приборы категорически нельзя подключать через удлинители и почему это может привести к трагическим последствиям, рассказывает профессор кафедры наноэлектроники РТУ МИРЭА, доктор физико-математических наук Алексей Юрасов.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
