8 июля, 12:03

Университет ИТМО

Российские ученые создали модель, которая читает научную статью за минуту вместо полутора часов

❋ 4.5

Ученые из ИТМО и МГУ представили мультиагентную систему NanoMINER для автоматизированного извлечения и обработки данных из научных статей в области наноматериалов и нанозимов. Анализ статьи занимает у системы всего минуту, тогда как на ручную обработку уходит в среднем полтора часа. NanoMINER демонстрирует высокую точность до 98% и позволит ускорить исследования в материаловедении, бионанотехнологиях и других областях.

Университет ИТМО

# искусственный интеллект

# код

# нанозимы

# научные статьи

Создана модель, которая читает научную статью за минуту / © Michał Parzuchowski, unsplash.com

Результаты исследования опубликованы в журнале npj Computational Materials. Ключевая информация о свойствах, составе и поведении наноматериалов часто представлена в неструктурированном виде внутри статей. Ручное извлечение является крайне трудоемким и медленным процессом, затрудняющим масштабный анализ и создание баз данных. Решить эту проблему можно с помощью автоматизированных систем извлечения данных. Однако большинство существующих решений в этой области имеют ряд ограничений: работают только с текстом, требуют участия человека или не обрабатывают полные статьи.

Для решения этих ученые из ИТМО совместно с коллегой из МГУ представили систему NanoMINER, которая работает с данными о наноматериалах и нанозимах. NanoMINER обрабатывает научные статьи, включая текст, изображения и графики, используя комбинацию моделей, в частности, GPT-4o (для анализа текста и связывания информации) и YOLO (для обработки визуальных данных).

Алгоритм прост и не требует специальных знаний. Пользователю нужно загрузить статью в интерфейс NanoMINER, а система выдаст структурированный набор данных, извлеченный из текста: например, информацию о составе материала, условиях синтеза, свойствах и результатах, а также может предсказать тип кристаллической решетки по химической формуле. Автоматизированный анализ статьи занимает одну минуту по сравнению со средними 90 минутами при ручной обработке.

Точность системы ученые проверили на верифицированных вручную данных из 20 предыдущих работ. Авторы оценивали полноту, точность и согласованность извлеченной информации. Оказалось, что модель распознает данные с высокой точностью — до 98% для кинетических параметров нанозимов и до 66% для молекулярных характеристик наноматериалов (химических формул, кристаллических систем и параметров поверхности).

Разработка доступна для всех желающих — исходный код и инструкция по установке программы опубликованы на платформе GitHub. Любой исследователь может скачать систему, развернуть ее локально на своем компьютере или сервере и использовать для извлечения данных из любых статей. Ученые уверены, что их решение найдет применение как в академической среде, так и среди практикующих специалистов, работающих с наноматериалами, химическими базами данных и ИИ-моделями.

«Вскоре мы планируем добавить новые направления исследований для сбора, включая токсичность наночастиц, биосовместимость, каталитические свойства и другие важные характеристики. Параллельно улучшаем точность извлечения информации, тестируем различные архитектуры языковых моделей — как открытые, так и коммерческие через API — и ищем оптимальный баланс между качеством и доступностью. Уверены, что нашу систему можно будет адаптировать для применения и в других областях — например, биомедицине. В будущем модель может стать основой для создания масштабируемых баз данных, автоматически обновляемых на основе новых публикаций», — рассказала автор оригинальной идеи исследования и соавтор статьи, инженер Передовой инженерной школы ИТМО, ассистент факультета биотехнологий ИТМО Юлия Разливина.

Исследование поддержано программой «Приоритет 2030».

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Университет ИТМО (Санкт-Петербург) — национальный исследовательский университет, ведущий вуз России в области информационных и фотонных технологий. Альма-матер победителей международных соревнований по программированию: ICPC (единственный в мире семикратный чемпион), Google Code Jam, Facebook Hacker Cup, Яндекс.Алгоритм, Russian Code Cup, Topcoder Open и др. Приоритетные направления: IT, фотоника, робототехника, квантовые коммуникации, трансляционная медицина, урбанистика, Art&Science, Science Communication.

Университет ИТМО

# искусственный интеллект

# код

# нанозимы

# научные статьи

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Архитектурные утопии XX века

Библиотека им. М. Ю. Лермонтова

Санкт-Петербург

Лекция

19 Авг

Бесплатно

Русские мифы: как и зачем их исследуют ученые?

Альпина нон-фикшн

Москва

Библиотека им. М. Ю. Лермонтова

Санкт-Петербург

Лекция

20 Авг

Бесплатно

Русское зарубежье и советские граждане в Движении Сопротивления

Библиотека иностранной литературы

Москва

Лекция

20 Авг

700 ₽

Неожиданная биология: ключевые открытия июля

Центр «Архэ»

Онлайн

Лекция

20 Авг

Бесплатно

Пять принципов здоровья

ВДНХ

Москва

Лекция

20 Авг

Бесплатно

О хвостиках, ушках и лапках. Собаки в космосе

Космонавтика и авиация

Москва

Лекция

21 Авг

Бесплатно

Зоопарки Юго-Восточной Азии: оазисы биоразнообразия

Московский зоопарк

Москва

Космонавтика и авиация

Москва

Популярное

За сутки

За неделю

За месяц

18 августа, 11:11

Денис Яковлев

Ученые прочитали мысли с рекордной точностью

За последнее десятилетие ученые создали несколько сложных систем «мозг — компьютер», которые позволяли преобразовывать мозговую активность людей, лишившихся способности говорить из-за различных заболеваний, в речь. Однако до сих пор удавалось расшифровать лишь небольшое количество слов. Теперь в США создали алгоритм, благодаря которому удалось распознать до 54 процентов «речи».

Медицина

# имплантация

# интерфейс мозг-компьютер

# нейробиология

# речь

18 августа, 15:57

Александр Березин

SpaceX выявила причину аварии Starship и намерена отправить его в десятый полет

В отличие от 2024 года, все четыре полета новой космической транспортной системы в 2025-м проходили неудачно. Но теперь компания Илона Маска полагает, что надежно выявила причины последней аварии, и рассчитывает на успешный полет. От того, насколько она права, зависит первая в XXI веке высадка людей на Луну.

Космонавтика

# SpaceX

# StarShip

# космос

# США

18 августа, 17:47

Елена Авдеева

Финансовая нестабильность во время беременности повлияла на мозг младенца

Стресс, инфекции, вредные привычки матери — неблагоприятные факторы влияют на развитие нервной системы плода в утробе и могут привести к нарушениям когнитивных функций. Американские ученые исследовали, в частности, как отражается на развитии головного мозга малыша нестабильность доходов родителей.

Психология

# беременность

# доход

# здоровье мозга

# когнитивное развитие

# младенцы

16 августа, 19:09

Адель Романова

На третьем межзвездном объекте нашли воду, и для кометы он выделяет ее необычно интенсивно

Астрономы подсчитали, что с поверхности летящего по Солнечной системе межзвездного объекта 3I/ATLAS каждую секунду испаряется около 40 килограммов водяного льда. Такую сильную кометную активность он проявил, будучи в три с половиной раза дальше Земли от Солнца. По мнению ученых, это довольно необычно.

Астрономия

# кометы

# космос

# межзвездная комета

# межзвездные объекты

# Солнечная система

15 августа, 08:25

Любовь С.

Астрономы объяснили природу «Ока Саурона», которое «смотрит» на Землю

Изображение блазара PKS 1424+240, полученное с помощью радиоинтерферометра VLBA, напомнило астрономам легендарное «Око Саурона» из «Властелина колец» — джет, пронизывающий кольцеобразное магнитное поле объекта, устремлен к нашей планете, а сам блазар может оказаться одним из наиболее ярких источников нейтрино в космосе.

Астрономия

# блазары

# джет

# космические лучи

# нейтрино

# радиоастрономия

# сверхмассивные черные дыры

18 августа, 11:11

Денис Яковлев

Ученые прочитали мысли с рекордной точностью

Медицина

# имплантация

# интерфейс мозг-компьютер

# нейробиология

# речь

25 июля, 07:47

Адель Романова

У третьего межзвездного объекта нашли признаки управляемого корабля

Прибывшая из межзвездного пространства предполагаемая комета 3I/ATLAS движется по траектории, максимально удобной для гравитационных маневров управляемого корабля, при этом возможность ее отслеживания с Земли практически минимальна. По мнению некоторых ученых, такое «поведение» объекта наводит на определенные мысли.

Астрономия

# внеземные цивилизации

# космос

# межзвездная комета

# межзвездные зонды

# межзвездные объекты

6 августа, 20:59

Татьяна Пичугина

Ученые добыли новые доказательства столкновения с кометой 12 800 лет назад

Примерно 12 800 лет назад в Северном полушарии началось резкое изменение климата, которое сопровождалось вымиранием мегафауны и угасанием культуры Кловис. Такое могло произойти, например, из-за прорыва пресных вод в Атлантику или мощного вулканического извержения. Несколько лет назад ученые обнаружили места на суше с повышенным содержанием элементов платиновой группы, прослоями угля, микрочастицами расплава. По их мнению, это может быть признаком пребывания Земли в потоке обломков кометы или астероида. В новой работе впервые представлены доказательства кометного события в позднем дриасе из морских осадочных толщ.

Геология

# Атлантический океан

# комета

# морское дно

# платина

# событие позднего дриаса

22 июля, 14:44

ФизТех

Ученые выяснили, как отличить текст, написанный ИИ, от человеческого

Команда исследователей из Сколтеха, МФТИ, Института искусственного интеллекта AIRI и других научных центров разработала метод, позволяющий не просто отличать тексты, написанные человеком, от сгенерированных нейросетью, но и понимать, по каким именно признакам классификатор принимает решение о том, является ли текст генерацией или нет. Анализируя внутренние состояния глубоких слоев языковой модели, ученые смогли выделить и интерпретировать численные признаки, отвечающие за стилистику, сложность и «степень уверенности» текста.

ФизТех

# ChatGPT

# нейросети

# ошибки

# слова

# текст

[miniorange_social_login]

Российские ученые создали модель, которая читает научную статью за минуту вместо полутора часов

По теме

Созданы нейросети для обнаружения сгенерированных вставок в текстах

Ученые научат роботов с ИИ размножаться и развиваться

Компьютер научили эффективно распознавать «эмоциональность» изображений

Популярное

Ученые прочитали мысли с рекордной точностью

SpaceX выявила причину аварии Starship и намерена отправить его в десятый полет

Финансовая нестабильность во время беременности повлияла на мозг младенца

На третьем межзвездном объекте нашли воду, и для кометы он выделяет ее необычно интенсивно

Астрономы объяснили природу «Ока Саурона», которое «смотрит» на Землю

Ученые прочитали мысли с рекордной точностью

У третьего межзвездного объекта нашли признаки управляемого корабля

Ученые добыли новые доказательства столкновения с кометой 12 800 лет назад

Ученые выяснили, как отличить текст, написанный ИИ, от человеческого

Комментарии

Хотите
вести колонку
в нашем
издании?

Колумнисты 64

ПНИПУ

ФизТех

Сколтех

НИУ ВШЭ

ТюмГУ

РНФ

ЮФУ

МГППУ

НИТУ МИСИС

КНЦ РАН

Билл Гейтс хочет осыпать Землю мелом, чтобы спасти человечество. Сколько людей умрет в результате?

Введение в Теорию всего: просто – о главной цели современной физики

«Карлики» в деталях: как много вы знаете о самых крошечных планетах Солнечной системы?

Неопознанные плавающие объекты

Как мы разрушили озоновый слой и что это значит для климата Земли? Интервью с Евгением Розановым

Топ главных детищ Илона Маска

Итоги года: 10 самых популярных материалов

Вопросы читателей (ч. 4)

Российские ученые создали модель, которая читает научную статью за минуту вместо полутора часов

По теме

Созданы нейросети для обнаружения сгенерированных вставок в текстах

Ученые научат роботов с ИИ размножаться и развиваться

Компьютер научили эффективно распознавать «эмоциональность» изображений

Популярное

Комментарии

Хотите вести колонку в нашем издании?

Колумнисты 64

ПНИПУ

ФизТех

Сколтех

НИУ ВШЭ

ТюмГУ

РНФ

ЮФУ

МГППУ

НИТУ МИСИС

КНЦ РАН

Хотите
вести колонку
в нашем
издании?