13.06.2024, 11:00

НИУ ВШЭ

Обучение с подкреплением позволило лучше работать генеративным потоковым нейросетям

❋ 4.4

Ученые Центра ИИ и Института искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ применили классические алгоритмы обучения с подкреплением для настройки генеративных потоковых сетей (GFlowNets). Это позволило улучшить работу GFlowNets, которые применяются уже три года для решения сложнейших научных задач на этапах моделирования, генерации гипотез и экспериментального проектирования.

НИУ ВШЭ

# машинное обучение

# нейросети

# языковые модели

Обучение с подкреплением позволило лучше работать генеративным потоковым нейросетям / © С М, unsplash.com

Результаты работы вошли в пять процентов лучших публикаций на Международной конференции по искусственному интеллекту и статистике AISTATS, которая состоялась 2–4 мая 2024 года в Валенсии.

Генеративные потоковые сети (GFlowNets) — это метод в машинном обучении, который помогает создавать разнообразные и качественные образцы данных благодаря тому, что настраивает модель генерировать вариативные объекты с высокими наградами. Их начали внедрять в 2021 году, и с тех пор они применяются в различных областях: в обучении языковых моделей, в комбинаторной оптимизации (например, составлении сложных расписаний), дизайне печатных плат, моделировании молекул лекарств с заданными свойствами и прочее.

«Устройство GFlowNets можно описать на примере конструктора лего: по недостроенному объекту и набору доступных деталей модель будет пытаться предсказать, в какое место и с какой вероятностью нужно добавить деталь, чтобы по итогу мы могли с большой вероятностью собрать хороший макет машины или корабля», — объясняет Никита Морозов, стажер-исследователь Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ.

Обучение с подкреплением (Reinforcement Learning, RL) — одна из парадигм машинного обучения, в которой агент обучается взаимодействовать со средой с целью максимизации функции награды. Классическая модель, построенная на основе обучения с подкреплением, AlphaGo, — первая в мире программа, победившая в настольную игру го профессионального игрока.

Генеративные потоковые сети и обучение с подкреплением схожи тем, что в качестве обучающего сигнала получают функцию награды. Однако GFlowNets пытается не максимизировать награду, а обучиться генерировать объекты с вероятностями, пропорциональными награде.

Ученые Центра ИИ и Института искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ впервые показали, что задача обучения генеративных потоковых сетей максимально схожа с общей задачей обучения с подкреплением, а также применили специализированные методы обучения с подкреплением для генерации дискретных объектов, например молекулярных графов.

Алексей Наумов, научный руководитель Центра ИИ, директор по фундаментальным исследованиям Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ : «Мы показали, что классические алгоритмы обучения с подкреплением применительно к GFlowNets работают сравнимо и даже эффективнее известных современных подходов, разработанных специально для обучения этих моделей. Так, в рамках задачи моделирования молекул лекарств с заданными свойствами за время обучения нашего метода было сгенерировано на 30 процентов больше высококачественных молекул, чем у существующих методов»‎.

Исследователи подчеркивают, что использование существующих методов обучения с подкреплением для обучения GFlowNet напрямую, без дополнительной адаптации этих методов, позволит ускорить прогресс развития новых методов в медицинской химии, материаловедении, энергетике, биотехнологиях и во многих других областях, где GFlowNet нашли применение за три года существования. Исследование поддержано грантом для исследовательских центров в области искусственного интеллекта, предоставленным Аналитическим центром при Правительстве России.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Национальный исследовательский университет «Высшая школа экономики» — один из крупнейших и самых востребованных вузов России. В университете учится 54 тысячи студентов и работает почти 4,5 тысячи учёных и преподавателей. НИУ ВШЭ ведёт фундаментальные и прикладные исследования в области социально-экономических, гуманитарных, юридических, инженерных, компьютерных, физико-математических наук, а также креативных индустрий. В университете действуют 47 центров превосходства, или международных лабораторий. Вышка объединяет ведущих мировых исследователей в области изучения мозга, нейротехнологий, биоинформатики и искусственного интеллекта. Университет входит в первую группу программы «Приоритет-2030» в направлении «Исследовательское лидерство». Кампусы НИУ ВШЭ расположены в четырех городах — Москве, Санкт-Петербурге, Нижнем Новгороде и Перми, а также в цифровом пространстве — «Вышка Онлайн».

НИУ ВШЭ

# машинное обучение

# нейросети

# языковые модели

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Лингвистические итоги 2025 года

Центр «Архэ»

Онлайн

ВДНХ

Москва

Лекция

01 Фев

Бесплатно

IT-стартапы: как рождаются технологические гиганты

ВДНХ

Москва

Лекция

01 Фев

Бесплатно

Изоляционные эксперименты: взгляд с двух сторон

Космонавтика и авиация

Москва

Лекция

01 Фев

Бесплатно

Сказки разные и одинаковые: сравнительная фольклористика сегодня

ВДНХ

Москва

Лекция

02 Фев

Бесплатно

Бобры сквозь время: от «чертовых штопоров» до инженеров природы

Центр «Архэ»

Онлайн

Лекция

02 Фев

Бесплатно

Удивительное разнообразие сфагновых мхов

Центр «Архэ»

Онлайн

Лекция

03 Фев

1000 ₽

Хоботные: эволюционная поступь гигантов

Центр «Архэ»

Москва

Лекция

03 Фев

Бесплатно

Искусство Восточной Римской империи IV-XV веков

ВДНХ

Москва

Популярное

За сутки

За неделю

За месяц

29 января, 19:38

Александр Березин

Исчезновение морского льда на Шпицбергене не помешало белым медведям растолстеть

Некоторые исследователи предполагали, что по мере исчезновения морского льда белые медведи потеряют кормовую базу и начнут умирать от истощения. Однако их популяция, живущая в районе максимального исчезновения морского льда, напротив, существенно прибавила в весе.

Биология

# арктика

# белые медведи

# глобальное потепление

# Шпицберген

30 января, 14:05

Игорь Байдов

Детеныши зауроподов спасали хищников юрского периода от голодной смерти

Авторы нового исследования с помощью комплексного моделирования восстановили пищевую цепь древних хищников поздней юры и определили ее самое уязвимое звено.

Палеонтология

# динозавры

# древние виды

# зауроподы

# тероподы

# Юрский период

30 января, 15:08

МГППУ

Психологи изучили языковые стратегии кибербуллинга и их последствия

Кибербуллинг — преднамеренное и повторяющееся агрессивное поведение в цифровой среде, направленное против одного человека или группы. Он может включать оскорбления, угрозы, распространение ложной информации или исключение из группы в социальной сети. В отличие от традиционных конфликтов, онлайн-травля усиливается анонимностью, широким охватом аудитории и постоянным доступом к сообщениям, а это затрудняет защиту жертвы. Исследование, проведенное среди студентов Московского государственного психолого-педагогического университета подтверждает высокую распространенность явления: около 30% опрошенных сталкивались с ним за последний год. Это особенно актуально для молодежи, проводящей много времени в интернете. Психологи МГППУ отобрали посты в соцсетях с агрессивным содержанием и провели анализ.

МГППУ

# агрессия

# буллинг

# кибербуллинг

# психолгогия

# стресс

# студенты

28 января, 10:50

Игорь Байдов

В Мексике нашли небольшого динозавра, решавшего споры лбом

Международная команда палеонтологов описала новый вид динозавра размером с крупную современную птицу. Он носил на голове плотный костяной нарост, который эти животные, возможно, использовали для внутривидовых разборок. Находка показывает, что даже мелкие хищники мелового периода могли решать конфликты не только когтями и зубами, но и ударами головой.

Палеонтология

# динозавры

# древние виды

# древние животные

# меловой период

26 января, 14:26

Александр Березин

Анализ лунного грунта опроверг космическое происхождение земной воды

Образцы грунта, взятые астронавтами полвека назад, вложили еще один важный кирпич в здание научной картины мира: гипотеза о том, что Земля исходно была сухой, не стыкуется с фактами. Похоже, идею о невозможности сохранения большого количества воды на «теплых» планетах придется пересмотреть.

Астрономия

# внеземная вода

# Земля

# Луна

25 января, 16:53

Evgenia Vavilova

Биологи считают, что животным в зоопарках слишком хорошо

В зоопарках звери доживают до старости и выбывают из программ глобального сохранения видов, потому что не могут размножаться. Это ставит под угрозу усилия по поддержанию популяций редких видов.

Биология

# вымирающий вид

# генетическое разнообразие

# животные

# зоопарки

# млекопитающие

# размножение

# старение

12 января, 15:39

Александр Березин

Рыбы захватили Мировой океан только благодаря массовому вымиранию

От рыб произошли все наземные позвоночные, включая нас, но как именно рыбы стали главным населением морей — до последнего времени оставалось неясным. Авторы новой научной работы попытались доказать, что причиной этого было вымирание, возможно, вызванное белыми ночами.

Палеонтология

# биология

# массовые вымирания

# ордовикско-силурийское вымирание

# Палеонтология

# рыбы

# челюстноротые

28 января, 10:50

Игорь Байдов

В Мексике нашли небольшого динозавра, решавшего споры лбом

Палеонтология

# динозавры

# древние виды

# древние животные

# меловой период

26 января, 14:26

Александр Березин

Анализ лунного грунта опроверг космическое происхождение земной воды

Астрономия

# внеземная вода

# Земля

# Луна

[miniorange_social_login]

Обучение с подкреплением позволило лучше работать генеративным потоковым нейросетям

По теме

В ПНИПУ разработали программу для прогнозирования характеристик сплавов

Человеческое восприятие помогло ИИ улучшить качество аудиозаписей

Физики МФТИ приблизили создание квантового компьютера в России

Популярное

Исчезновение морского льда на Шпицбергене не помешало белым медведям растолстеть

Детеныши зауроподов спасали хищников юрского периода от голодной смерти

Психологи изучили языковые стратегии кибербуллинга и их последствия

В Мексике нашли небольшого динозавра, решавшего споры лбом

Анализ лунного грунта опроверг космическое происхождение земной воды

Биологи считают, что животным в зоопарках слишком хорошо

Рыбы захватили Мировой океан только благодаря массовому вымиранию

В Мексике нашли небольшого динозавра, решавшего споры лбом

Анализ лунного грунта опроверг космическое происхождение земной воды

Комментарии

Хотите
вести колонку
в нашем
издании?

Колумнисты 65

ПНИПУ

ФизТех

НИУ ВШЭ

Сколтех

ТюмГУ

РНФ

ЮФУ

МГППУ

РТУ МИРЭА

НИТУ МИСИС

Как мы умрем: рейтинг причин человеческой смертности

Будапештский меморандум в шкафу: сможет ли Украина вернуть ядерное оружие?

7 исторических параллелей к «Игре престолов»

Кофе: вред, польза и… наслаждение

Заправка на орбите: ключ к новому космосу

Вопросы читателей (ч. 6)

Психология нот: как мы воспринимаем музыку

Веселая география

Обучение с подкреплением позволило лучше работать генеративным потоковым нейросетям

По теме

В ПНИПУ разработали программу для прогнозирования характеристик сплавов

Человеческое восприятие помогло ИИ улучшить качество аудиозаписей

Физики МФТИ приблизили создание квантового компьютера в России

Популярное

Комментарии

Хотите вести колонку в нашем издании?

Колумнисты 65

ПНИПУ

ФизТех

НИУ ВШЭ

Сколтех

ТюмГУ

РНФ

ЮФУ

МГППУ

РТУ МИРЭА

НИТУ МИСИС

Хотите
вести колонку
в нашем
издании?