15 мая, 10:59

НИУ ВШЭ

Нейросеть научили анализировать научные статьи и патенты на русском языке

❋ 4.6

Исследователи НИУ ВШЭ учат большие языковые модели понимать русскоязычную научную терминологию, увеличивая при этом их энергоэффективность. Адаптированная модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная открытая модель, что позволяет запускать ее на более доступном оборудовании.

НИУ ВШЭ

# искусственный интеллект

# нейросети

# русский язык

# технологии

Робот читает книгу / © ИИ-генерация, freepik

Объем научно-технической информации (патентов, статей, отчетов) с каждым днем стремительно увеличивается. Эффективно работать с этим массивом данных помогает искусственный интеллект. Как правило, большие языковые модели, представленные на рынке, мультиязычные и обучены на разных языках. Но в популярных чат-ботах с генеративным искусственным интеллектом, таких как ChatGPT, превалируют данные на английском, что грозит появлением монокультуры данных в области ИИ.

Ученые Института статистических исследований и экономики знаний НИУ ВШЭ дообучили существующие большие языковые модели, чтобы получить инструмент, способный более точно анализировать научные тексты на русском языке с пониманием предметной специфики. Основой послужил корпус данных iFORA-QA, вручную собранный более чем 150 экспертами ИСИЭЗ из аналитических материалов и отчетов в области науки, технологий и инноваций. Программа прошла государственную регистрацию.

После адаптации точность модели при ответах на узкопрофессиональные вопросы в сфере науки, технологий и инноваций выросла, скорость генерации увеличилась в 2,7 раза, а использование памяти сократилось на 73% по сравнению с открытой мультиязычной моделью.

«Универсальные языковые модели знают много, но поверхностно. Нам же нужна модель, которая понимает, о чем пишут российские ученые и инженеры. Благодаря проведенным исследованиям мы смогли научить алгоритм мыслить в категориях предметной области, понимать связи между сложными понятиями и корректно интерпретировать запросы», — комментирует главный аналитик проекта, научный сотрудник и ведущий эксперт Центра стратегической аналитики и больших данных ИСИЭЗ Анастасия Малашина.

Уже в этом году исследователи разработают дополнительные полезные инструменты на базе адаптированной модели. Первым станет умный поисковик — он снизит риски галлюцинирования модели и будет формировать выводы только со ссылками на научные источники информации. Второй инструмент — граф связей, который позволит выявлять закономерности, в том числе скрытые, на основе структуры источников. Кроме того, модель получит способность работать с неполной и неоднозначной информацией, а также рассуждать, то есть не просто давать ответ, а сначала анализировать, чего ей не хватает, задавать уточняющие вопросы пользователю и только потом формулировать подробный ответ.

В итоге все эти возможности объединятся в единую мультиагентную систему, которая позволит решать сложные задачи автоматически.

«Мы создаем целостную систему интеллектуальных агентов, адаптированную под реалии российской науки. Она будет работать на базе большой языковой модели и сможет автономно анализировать научно-техническую информацию и выявлять скрытые связи. Это шаг к автоматизации научной аналитики, где ИИ становится партнером исследователя», — подчеркивает Анастасия Малашина.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Национальный исследовательский университет «Высшая школа экономики» — один из крупнейших и самых востребованных вузов России. В университете учится 54 тысячи студентов и работает почти 4,5 тысячи учёных и преподавателей. НИУ ВШЭ ведёт фундаментальные и прикладные исследования в области социально-экономических, гуманитарных, юридических, инженерных, компьютерных, физико-математических наук, а также креативных индустрий. В университете действуют 47 центров превосходства, или международных лабораторий. Вышка объединяет ведущих мировых исследователей в области изучения мозга, нейротехнологий, биоинформатики и искусственного интеллекта. Университет входит в первую группу программы «Приоритет-2030» в направлении «Исследовательское лидерство». Кампусы НИУ ВШЭ расположены в четырех городах — Москве, Санкт-Петербурге, Нижнем Новгороде и Перми, а также в цифровом пространстве — «Вышка Онлайн».

НИУ ВШЭ

# искусственный интеллект

# нейросети

# русский язык

# технологии

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Medio Modo

Санкт-Петербург

Лекция

16 Май

1000 ₽

Survival guide в эпоху немирного атома. Что делать, если дозиметр сходит с ума?

Medio Modo

Москва

Лекция

16 Май

Бесплатно

История одного изобретения: кольчужный доспех — от кельтов до спецназа

Российская государственная библиотека

Москва

Лекция

16 Май

Бесплатно

Биотехнологии: от биопечати органов до стейка из пробирки

ВДНХ

Москва

Medio Modo

Москва

Лекция

16 Май

Бесплатно

Космические расстояния

Космонавтика и авиация

Москва

Экскурсия

16 Май

700 ₽

Энергия и движение: вопросы, опыты, экспонаты

Политехнический музей

Москва

Лекция

16 Май

Бесплатно

Минск. Интернациональное лицо идеального социалистического города

ВДНХ

Москва

Политехнический музей

Москва

Популярное

За сутки

За неделю

За месяц

14 мая, 09:34

Максим Абдулаев

Виноградный жмых помог вырастить здоровых кур без антибиотиков

Отходы виноделия служат полноценной заменой антибиотикам в птицеводстве. Всего полпроцента виноградного жмыха в рационе бройлеров с хроническим воспалением кишечника восстановили рост птиц, подавили патогенные бактерии и улучшили качество мяса. В отличие от традиционных стимуляторов роста, жмых не провоцирует появление супербактерий, предлагая индустрии дешевую и экологичную альтернативу.

Биология

# антибиотики

# виноград

# птицефабрики

# супербактерии

14 мая, 16:06

Илья Гриднев

Неандертальцы лечили зубы каменными сверлами 60 000 лет назад

Российские антропологи изучили коренной моляр неандертальца из алтайской пещеры, в котором было крупное углубление, выглядящее искусственным. Анализ показал, что около 60 тысяч лет назад в зубе высверлили пораженные ткани заостренным камнем. Находка отодвинула первое известное применение инвазивных стоматологических процедур на 45 тысяч лет в прошлое.

Антропология

# каменные орудия

# лечение зубов

# неандертальцы

# палеолит

15 мая, 09:59

Максим Абдулаев

Растение риса поймало и убило гусеницу-вредителя

Американские исследователи обнаружили неожиданный физический механизм защиты у риса. Оказалось, что сельскохозяйственная культура способна уничтожать гусениц кукурузной лиственной совки, заманивая их внутрь своих колосков. Жесткие микроскопические волоски (трихомы) не дают насекомому выбраться, а затем створки зерна закрываются и смертельно сдавливают вредителя.

Биология

# ботаника

# защита растений

# рис

8 мая, 17:12

СПбГУ

В России открыли новый способ борьбы с неконтролируемой агрессией

Нейробиологи СПбГУ продемонстрировали, что активация рецептора следовых аминов TAAR1 эффективно подавляет агрессивное поведение, вызванное полным отсутствием серотонина в мозге. В дальнейшем этот результат поможет в разработке лекарственных препаратов, направленных на коррекцию патологических форм агрессии, возникающих при посттравматическом стрессовом расстройстве (ПТСР) и шизофрении.

СПбГУ

# агрессия

# нейробиология

# саморегуляция

# серотонин

14 мая, 09:34

Максим Абдулаев

Виноградный жмых помог вырастить здоровых кур без антибиотиков

Биология

# антибиотики

# виноград

# птицефабрики

# супербактерии

11 мая, 06:54

Лена

Динозавры заботились о детенышах как современные птицы

Крупные травоядные утконосые майазавры известны своим развитым социальным поведением. Они жили семьями и строили гнезда для своих детенышей. Даже название вида переводится с греческого языка как «ящер — хорошая мать». Исследование окаменелых зубов майазавров показало, что они выращивали детенышей совсем не так, как это считалось типичным для животных глубокой древности.

Палеонтология

# гнезда

# динозавры

# зубы

# окаменелости

# поведение

# потомство

23 апреля, 18:34

Александр Березин

С Плесецка без предупреждения запустили легкую ракету «Ангара»

В последнее время пуски с российских северных космодромов осуществляют без предварительного уведомления, чего не было в прошлом. Вероятно, дело в недавно упомянутых главой «Роскосмоса» атаках на Плесецк во время пуска. Сегодняшний запуск обеспечил вывод на орбиту космических аппаратов военного назначения.

Космонавтика

# космонавтика

# космос

# Россия

21 апреля, 20:03

Evgenia Vavilova

Физики выяснили, что электроника деградирует не по накопительному, а по квантовому механизму

Химические связи в материале, из которого сделана электроника, разрываются не из-за накопительного износа от протекания тока через них, а из-за электронов с конкретной энергией.

Физика

# водород

# горячие электроны

# деградация

# полупроводники

# электроника

20 апреля, 13:29

Илья Гриднев

Ученые доказали, что термоядерная энергетика никогда не будет рентабельна

Термоядерные электростанции не смогут конкурировать по цене с возобновляемыми источниками энергии из-за медленного удешевления технологии. По расчетам, расходы на каждую новую установку падали максимум на 8% — много раз ниже ранних ожиданий венчурных инвесторов. Это перечеркивает экономический смысл финансовых вливаний, и мир может никогда не увидеть дешевой термоядерной энергии.

Технологии

# инновации

# ИТЭР

# термоядерный реактор

# экономика

# энергетика

[miniorange_social_login]

Нейросеть научили анализировать научные статьи и патенты на русском языке

По теме

Исследователи выяснили, как нейросети понимают каламбуры

Экзамен на выносливость: в России cоздали первый масштабный набор тестов для нейросетей на «понимание» длинных текстов

Искусственный интеллект обретает здравомыслие: новый метод заставил нейросети сомневаться в своих ответах

Популярное

Виноградный жмых помог вырастить здоровых кур без антибиотиков

Неандертальцы лечили зубы каменными сверлами 60 000 лет назад

Растение риса поймало и убило гусеницу-вредителя

В России открыли новый способ борьбы с неконтролируемой агрессией

Виноградный жмых помог вырастить здоровых кур без антибиотиков

Динозавры заботились о детенышах как современные птицы

С Плесецка без предупреждения запустили легкую ракету «Ангара»

Физики выяснили, что электроника деградирует не по накопительному, а по квантовому механизму

Ученые доказали, что термоядерная энергетика никогда не будет рентабельна

Комментарии

Хотите
вести колонку
в нашем
издании?

Колумнисты 66

ПНИПУ

ФизТех

НИУ ВШЭ

Сколтех

ТюмГУ

РНФ

ЮФУ

МГППУ

РТУ МИРЭА

НИТУ МИСИС

Гаджеты и дети: давать нельзя запретить

Китайский ответ на Пелоси: состоится ли десант на Тайвань?

Александр Панчин: «ГМО – это хорошо»

Потепление сократило производительность сельского хозяйства на 21%… но только внутри башни из слоновой кости. А в реальном мире увеличило как минимум на 10%

NASA говорит о расследовании связи Маска и Путина: как это угрожает российской космонавтике?

«Останутся наши следы»: города на Луне, Марсе и Венере

Сколько секунд до Марса? Возьмут ли вас в полет на Красную планету? Тест Naked Science

Все сокровища Вселенной

Нейросеть научили анализировать научные статьи и патенты на русском языке

По теме

Исследователи выяснили, как нейросети понимают каламбуры

Экзамен на выносливость: в России cоздали первый масштабный набор тестов для нейросетей на «понимание» длинных текстов

Искусственный интеллект обретает здравомыслие: новый метод заставил нейросети сомневаться в своих ответах

Популярное

Комментарии

Хотите вести колонку в нашем издании?

Колумнисты 66

ПНИПУ

ФизТех

НИУ ВШЭ

Сколтех

ТюмГУ

РНФ

ЮФУ

МГППУ

РТУ МИРЭА

НИТУ МИСИС

Хотите
вести колонку
в нашем
издании?