• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
8 июля, 12:03
Университет ИТМО
2,9 тыс

Российские ученые создали модель, которая читает научную статью за минуту вместо полутора часов

❋ 4.5

Ученые из ИТМО и МГУ представили мультиагентную систему NanoMINER для автоматизированного извлечения и обработки данных из научных статей в области наноматериалов и нанозимов. Анализ статьи занимает у системы всего минуту, тогда как на ручную обработку уходит в среднем полтора часа. NanoMINER демонстрирует высокую точность до 98% и позволит ускорить исследования в материаловедении, бионанотехнологиях и других областях.

Создана модель, которая читает научную статью за минуту / © Michał Parzuchowski, unsplash.com

Результаты исследования опубликованы в журнале npj Computational Materials. Ключевая информация о свойствах, составе и поведении наноматериалов часто представлена в неструктурированном виде внутри статей. Ручное извлечение является крайне трудоемким и медленным процессом, затрудняющим масштабный анализ и создание баз данных. Решить эту проблему можно с помощью автоматизированных систем извлечения данных. Однако большинство существующих решений в этой области имеют ряд ограничений: работают только с текстом, требуют участия человека или не обрабатывают полные статьи.

Для решения этих ученые из ИТМО совместно с коллегой из МГУ представили систему NanoMINER, которая работает с данными о наноматериалах и нанозимах. NanoMINER обрабатывает научные статьи, включая текст, изображения и графики, используя комбинацию моделей, в частности, GPT-4o (для анализа текста и связывания информации) и YOLO (для обработки визуальных данных).

Алгоритм прост и не требует специальных знаний. Пользователю нужно загрузить статью в интерфейс NanoMINER, а система выдаст структурированный набор данных, извлеченный из текста: например, информацию о составе материала, условиях синтеза, свойствах и результатах, а также может предсказать тип кристаллической решетки по химической формуле. Автоматизированный анализ статьи занимает одну минуту по сравнению со средними 90 минутами при ручной обработке.

Точность системы ученые проверили на верифицированных вручную данных из 20 предыдущих работ. Авторы оценивали полноту, точность и согласованность извлеченной информации. Оказалось, что модель распознает данные с высокой точностью — до 98% для кинетических параметров нанозимов и до 66% для молекулярных характеристик наноматериалов (химических формул, кристаллических систем и параметров поверхности).

Разработка доступна для всех желающих — исходный код и инструкция по установке программы опубликованы на платформе GitHub. Любой исследователь может скачать систему, развернуть ее локально на своем компьютере или сервере и использовать для извлечения данных из любых статей. Ученые уверены, что их решение найдет применение как в академической среде, так и среди практикующих специалистов, работающих с наноматериалами, химическими базами данных и ИИ-моделями.

«Вскоре мы планируем добавить новые направления исследований для сбора, включая токсичность наночастиц, биосовместимость, каталитические свойства и другие важные характеристики. Параллельно улучшаем точность извлечения информации, тестируем различные архитектуры языковых моделей — как открытые, так и коммерческие через API — и ищем оптимальный баланс между качеством и доступностью. Уверены, что нашу систему можно будет адаптировать для применения и в других областях — например, биомедицине. В будущем модель может стать основой для создания масштабируемых баз данных, автоматически обновляемых на основе новых публикаций», — рассказала автор оригинальной идеи исследования и соавтор статьи, инженер Передовой инженерной школы ИТМО, ассистент факультета биотехнологий ИТМО Юлия Разливина.

Исследование поддержано программой «Приоритет 2030».

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Университет ИТМО (Санкт-Петербург) — национальный исследовательский университет, ведущий вуз России в области информационных и фотонных технологий. Альма-матер победителей международных соревнований по программированию: ICPC (единственный в мире семикратный чемпион), Google Code Jam, Facebook Hacker Cup, Яндекс.Алгоритм, Russian Code Cup, Topcoder Open и др. Приоритетные направления: IT, фотоника, робототехника, квантовые коммуникации, трансляционная медицина, урбанистика, Art&Science, Science Communication.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
19 ноября, 14:04
Игорь Байдов

Долгие годы исследователи полагали, что внутренняя структура полости носа неандертальцев была устроена таким образом, что помогала этим людям переносить холод. Однако авторы нового исследования поставили под сомнение эту гипотезу. Ученые впервые проанализировали носовую полость неандертальца в хорошо сохранившемся черепе и выяснили, что его нос не был приспособлен к суровому климату.

18 ноября, 12:36
Игорь Байдов

Согласно учебникам истории, в бронзовом веке в казахской степи кочевали лишь немногочисленные племена со своими стадами. Но в начале 2000-х там обнаружили древнее поселение с остатками крупных домов, которое могло быть административным либо культурным центром. Это навело ученых на мысль, что жизнь в степи складывалась куда сложнее и была более организованной, чем предполагалось. Международная команда ученых представила новые результаты исследования этого поселения и выяснила, что на самом деле оно представляло собой крупнейший в этом регионе протогородской центр с масштабным производством оловянистой бронзы.

18 ноября, 18:24
Игорь Байдов

В темных лабиринтах подземного муравейника разыгрывается коварный сценарий, достойный политического триллера. Вместо того чтобы силой захватить трон, королева одного вида муравьев применяет хитрую тактику. Она проникает в чужую крепость и с помощью поддельного химического сигнала подстрекает верную стражу к свержению собственной повелительницы. Результат — жестокая казнь законной королевы и добровольное подчинение всего муравейника новой владычице.

18 ноября, 12:36
Игорь Байдов

Согласно учебникам истории, в бронзовом веке в казахской степи кочевали лишь немногочисленные племена со своими стадами. Но в начале 2000-х там обнаружили древнее поселение с остатками крупных домов, которое могло быть административным либо культурным центром. Это навело ученых на мысль, что жизнь в степи складывалась куда сложнее и была более организованной, чем предполагалось. Международная команда ученых представила новые результаты исследования этого поселения и выяснила, что на самом деле оно представляло собой крупнейший в этом регионе протогородской центр с масштабным производством оловянистой бронзы.

15 ноября, 21:54
Редакция Naked Science

Ю-Цон Тан (YuCong Tang) — концептуальный художник из Китая. Научно-фантастические мотивы — одно из основных направлений его творчества. Он исследует, как научные открытия и технологии будущего трансформируют среду обитания.

18 ноября, 18:24
Игорь Байдов

В темных лабиринтах подземного муравейника разыгрывается коварный сценарий, достойный политического триллера. Вместо того чтобы силой захватить трон, королева одного вида муравьев применяет хитрую тактику. Она проникает в чужую крепость и с помощью поддельного химического сигнала подстрекает верную стражу к свержению собственной повелительницы. Результат — жестокая казнь законной королевы и добровольное подчинение всего муравейника новой владычице.

25 октября, 10:40
Любовь С.

Проанализировав данные наблюдений, полученных с помощью наземных обсерваторий за последние два десятилетия, астрономы обнаружили потенциально обитаемый мир — суперземлю Gliese 251 c (GJ 251 с). Планета обращается вокруг красного карлика на расстоянии около 18 световых лет от Земли и считается одним из самых перспективных кандидатов для поисков жизни.

8 ноября, 18:29
Адель Романова

По расчетам, большинство «гостей» из других звездных систем летят к Земле примерно со стороны созвездия Геркулес. Скорее всего, они время от времени падают на нашу планету, просто мы еще не научились это замечать. Как удалось вычислить, чаще всего они должны падать зимой и где-то в окрестностях экватора.

24 октября, 14:02
РТУ МИРЭА

В современном доме, насыщенном разнообразной техникой, удлинители стали незаменимым атрибутом, позволяющим обеспечить электропитанием все необходимые устройства. Однако мало кто задумывается, что привычное использование этого аксессуара может нести серьезную угрозу безопасности. По статистике, значительная часть бытовых пожаров происходит из-за неправильной эксплуатации электропроводки и вспомогательных устройств. Какие приборы категорически нельзя подключать через удлинители и почему это может привести к трагическим последствиям, рассказывает профессор кафедры наноэлектроники РТУ МИРЭА, доктор физико-математических наук Алексей Юрасов.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно