Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Разработан алгоритм поиска научных статей с помощью нейросети
Специалисты НИЦ «Курчатовский институт» и МФТИ разработали систему семантического поиска научных публикаций по большим базам научных публикаций на основе информации о внешнем цитировании с использованием нейросетевых моделей.
Современные темпы роста объема научной информации требуют новых инструментов, позволяющих ученым искать и отбирать публикации на интересующие их темы.
Современные цифровые методы поиска научных статей включают в себя не только текстовые запросы и анализ цитирований, но и более сложные алгоритмы. Например, популярные системы Google Scholar и Scopus при ранжировании статей учитывают как ключевые слова, так и данные о цитированиях одних статей другими, что помогает найти наиболее релевантные материалы. Системы СoCites и Connected Papers умеют анализировать частоту, с которой статьи цитируют друг друга: это позволяет лучше выделять темы, идеи и концепции, наиболее актуальные для конкретной научной области.
Для улучшения точности поиска ученые постоянно ищут новые методы. Результаты работы опубликованы в научном журнале «Физика элементарных частиц и атомного ядра».
«Существующие сегодня методы поиска учитывают лишь частоту совместного цитирования. Разработанная нами система предлагает новый подход к поиску по научным публикациям — на основе кратких описаний результатов работ, используемых при цитировании одних статей другими. При обучении нейросетевой модели мы использовали базу англоязычных научных публикаций по биомедицине PubMed Central объемом 7,6 миллиона статей», — сообщила Дарья Доровских, лаборант-исследователь Курчатовского комплекса НБИКС-природоподобных технологий.
Из архива публикаций отбиралась информация о цитировании: текст авторского упоминания ключевых результатов другой работы и ссылка на нее. Затем с помощью нейросетевой модели BERT были созданы векторные представления этих упоминаний. Векторные представления позволяют хранить семантику слов в понятном для компьютера виде: векторы фиксируют информацию о значении слова на основе соседних слов в тексте.
Созданный прототип сервиса определяет семантический контекст и позволяет находить научные публикации по коротким описаниям. В том числе система может быстро найти статьи, даже если они не полностью соответствуют ключевым словам поискового запроса, но релевантны ему по теме.
Для удобства пользователей специалисты разработали веб-интерфейс на основе Python с использованием библиотек Flask и React для поиска статей. Систему протестировали на различных запросах, одни из которых составлялись вручную, другие автоматически выбирались из текста статей. Результаты показали, что новая система на основе нейросетевой модели BERT более точна, чем традиционные методы: она находит релевантные статьи быстрее и эффективнее. По словам ученых, прототип системы можно доработать с учетом особенностей сферы внедрения.
Ученые из МФТИ разработали и предложили новую систему единиц для электродинамики, способную примирить два главенствующих, но исторически несовместимых подхода. Эта компромиссная система, названная авторами физико-технической (ФТ), сохраняет практическое удобство Международной системы единиц (СИ), используемой инженерами по всему миру, и в то же время отражает теоретическую стройность и симметрию гауссовой системы (СГС), предпочитаемой физиками-теоретиками.
Обитающий в полярных районах Северного полушария гренландский кит (Balaena mysticetus) живет более двух столетий и почти не болеет раком. Секрет его долголетия оказался скрыт в клетках соединительной ткани, ответственной за заживление ран: при пониженной температуре в них активируется особый белок, усиливающий восстановление поврежденной ДНК.
Эксперимент, устроенный в морском аквариуме в Лос-Анджелесе, продемонстрировал, что акулы и скаты, принадлежащие к пластиножаберным рыбам, могут обладать более высоким уровнем интеллекта. Значит, им необходима обогащенная среда обитания при содержании в неволе.
В последнее время отказ от глютена, или клейковины — белков, содержащихся в пшенице, ржи и ячмене, — превратился в модный тренд. В соцсетях и СМИ некоторые популярные блогеры и знаменитости преподносят безглютеновые диеты как секрет хороших самочувствия и внешности. Тем не менее обзор десятков научных работ показал, что у большинства людей, считающих себя чувствительными к глютену, причина негативной реакции часто кроется не в самой клейковине.
Анализ астрономических фотопластинок середины XX века показал, что таинственные яркие точки на небе появлялись значительно чаще вблизи дат ядерных испытаний. Эти вспышки, зафиксированные еще до запуска первого спутника, также совпали с увеличением числа сообщений о неопознанных аномальных явлениях.
В одном из крупнейших комплексов звездообразования Млечного Пути — гигантском молекулярном облаке Лебедь X (Cygnus X) — впервые зафиксировали так называемый «темный» молекулярный газ. Эта форма межзвездной материи, невидимая в оптическом и инфракрасном диапазонах, позволит больше узнать о процессах зарождения звезд в Галактике.
Проанализировав данные наблюдений, полученных с помощью наземных обсерваторий за последние два десятилетия, астрономы обнаружили потенциально обитаемый мир — суперземлю Gliese 251 c (GJ 251 с). Планета обращается вокруг красного карлика на расстоянии около 18 световых лет от Земли и считается одним из самых перспективных кандидатов для поисков жизни.
Согласно новой гипотезе, сознание возникает не только из-за активности нейронов, но и благодаря физическим процессам — электромагнитным полям от движения жидкости в мозге. Эта модель, как и ее предшественники, пока носит теоретический характер, но предлагает нестандартный взгляд на проблему синхронизации работы разных отделов мозга.
В современном доме, насыщенном разнообразной техникой, удлинители стали незаменимым атрибутом, позволяющим обеспечить электропитанием все необходимые устройства. Однако мало кто задумывается, что привычное использование этого аксессуара может нести серьезную угрозу безопасности. По статистике, значительная часть бытовых пожаров происходит из-за неправильной эксплуатации электропроводки и вспомогательных устройств. Какие приборы категорически нельзя подключать через удлинители и почему это может привести к трагическим последствиям, рассказывает профессор кафедры наноэлектроники РТУ МИРЭА, доктор физико-математических наук Алексей Юрасов.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
