• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
05.12.2024, 15:12
Редакция Naked Science
15,5 тыс

Российские ученые создали первую в мире открытую виртуальную среду для самообучающегося ИИ

❋ 4.9

Разработка называется XLand-MiniGrid и позволяет тренируемому ИИ выполнять триллион взаимодействий с обучающей его средой всего за три дня.

Автомобили Waymo бибикают друг на друга ночью на парковке в США, 2024 год. Жители окрестных домов были не в восторге: автономные авто сами слабо реагируют на звуковые сигналы, поэтому перекличка шла долго. Для решения подобных проблем нужен более гибкий ИИ / © Wikimedia Commons

Хотя СМИ часто представляют эволюцию современного ИИ как непрерывную историю успеха, реальность заметно сложнее. Управление автономными автомобилями и БЛА остается проблемой: даже у самых сильных игроков отрасли вроде Waymo и Tesla машины периодически едут на красный свет или сигналят друг другу по ночам, несмотря на тот факт, что автономный автомобиль, в отличие от пилотируемого, практически не реагирует на звуковые сигналы.

Подобные истории неслучайны, но указывают на одно из узких мест современного ИИ: он неплохо работает в ситуациях, к которым его «готовили», обучая на большой выборке, но часто пасует перед редко встречающимися сложностями, которые лишь слабо (а то и вообще никак) представлены в его обучающей выборке.

Разумеется, ученые пытаются бороться с такими явлениями. Одно из средств — контекстное обучение с подкреплением (In-context Reinforcement Learning, или In-Context RL). Речь идет о сравнительно новом направлении в ИИ: такой подход позволяет модели быстро адаптироваться к новым задачам, отталкиваясь от подсказок и контекста, без длительного обучения с нуля.

В результате ИИ может эффективно взаимодействовать даже с весьма сложной окружающей средой и дообучаться на лету. In-Context RL считается перспективным в таких областях, как персонализированные рекомендации для покупателей интернет-магазинов, управление роботами и автономными автомобилями. Иными словам он востребованнее всего там, где требуется практически мгновенная адаптация к принципиально новым условиям.

Но для обучения такого ИИ нужны специальная виртуальная среда, своего рода цифровой полигон. Имеющиеся среды такого рода можно разделить на две категории. Одни неплохо разработаны, как Google DeepMind, но внутрикорпоративны, то есть закрыты для внешних пользователей. Второй вариант: они открыты, но сравнительно просты, поэтому предлагают для дообучения ИИ лишь однотипные и легкие задачи. На них добиться существенного прогресса проблематично. Поэтому в лаборатории T-Bank AI Research решили создать свою собственную открытую виртуальную среду.

«Мы пришли в область контекстного обучения с подкреплением, когда она еще зарождалась, поэтому не нашли ни одного подходящего инструмента для оценки новых идей. Стало понятно, что это проблема для многих специалистов, а значит, она должна быть решена одной из первых. Поэтому появился XLand-MiniGrid», — отметил ученый Вячеслав Синий из научной группы AI Alignment, входящей в лабораторию исследований искусственного интеллекта T-Bank AI Research.

Научная статья о новой виртуальной среде принята на крупнейшую международную конференцию в области ИИ — NeurIPS 2024. Ее представят там с 10 по 15 декабря в Ванкувере, Канада. Но еще до этого среду уже использовали в целом ряде исследований ученых из крупных зарубежных центров, разрабатывающих искусственный интеллект.

Новую среду создали на базе JAX — технологии для разработки высокопроизводительных программ. Поэтому, в отличие от более медленных открытых аналогов, XLand-MiniGrid выполняет миллиарды операций в секунду.

XLand-MiniGrid позволяет агентам совершать до одного триллиона взаимодействий со средой за три дня, что ускоряет эксперименты и проверку гипотез / © T-Bank AI Research

Еще там собрано 100 миллиардов примеров действий ИИ в 30 тысячах задач. За счет этого разработчики могут использовать готовые датасеты для обучения, а а не собирать их каждый раз с нуля. Такие особенности виртуальной среды для обучения ИИ упрощают исследования и новые открытия в этой области.

При этом, в отличие от уже существующих сред высокой сложности, XLand-MiniGrid находится в открытом доступе и выложена на GitHub.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
30 октября, 16:53
ФизТех

Ученые из МФТИ разработали и предложили новую систему единиц для электродинамики, способную примирить два главенствующих, но исторически несовместимых подхода. Эта компромиссная система, названная авторами физико-технической (ФТ), сохраняет практическое удобство Международной системы единиц (СИ), используемой инженерами по всему миру, и в то же время отражает теоретическую стройность и симметрию гауссовой системы (СГС), предпочитаемой физиками-теоретиками.

31 октября, 08:53
Любовь С.

Ученые из коллаборации LIGO, VIRGO и KAGRA впервые зафиксировали гравитационно-волновые события, указывающие на существование черных дыр второго поколения — «потомков» предыдущих слияний. Открытие позволит понять, как именно во Вселенной рождаются сверхмассивные черные дыры.  

31 октября, 10:14
Юлия Трепалина

Эксперимент, устроенный в морском аквариуме в Лос-Анджелесе, продемонстрировал, что акулы и скаты, принадлежащие к пластиножаберным рыбам, могут обладать более высоким уровнем интеллекта. Значит, им необходима обогащенная среда обитания при содержании в неволе.

30 октября, 16:53
ФизТех

Ученые из МФТИ разработали и предложили новую систему единиц для электродинамики, способную примирить два главенствующих, но исторически несовместимых подхода. Эта компромиссная система, названная авторами физико-технической (ФТ), сохраняет практическое удобство Международной системы единиц (СИ), используемой инженерами по всему миру, и в то же время отражает теоретическую стройность и симметрию гауссовой системы (СГС), предпочитаемой физиками-теоретиками.

27 октября, 11:44
Илья Гриднев

Исследователи объяснили, как цивилизация майя добивалась высокой точности в предсказании солнечных затмений на протяжении столетий. Для коррекции накапливающихся астрономических неточностей они использовали сложную систему пересекающихся календарных таблиц.

29 октября, 16:24
Юлия Трепалина

В последние годы содержание кошек дома без возможности свободного выгула все чаще преподносят как идеальную модель, которая ограждает дикую фауну от нападений и обеспечивает благополучие самих питомцев. Подобные утверждения в разных частях мира звучат от некоторых защитников природы и представителей властей. Однако группа ветеринаров из Австралии и Дании недавно раскритиковала такой подход. Ученые не спорят с тем, что кошки влияют на уязвимые экосистемы и что ограничение их свободы — действенная мера по смягчению этого эффекта. Тем не менее исследователи настаивают, что жизнь в изоляции для питомцев совсем не благо. Заявляющие обратное как минимум ошибаются, а в худшем случае намеренно вводят общественность в заблуждение.

25 октября, 10:40
Любовь С.

Проанализировав данные наблюдений, полученных с помощью наземных обсерваторий за последние два десятилетия, астрономы обнаружили потенциально обитаемый мир — суперземлю Gliese 251 c (GJ 251 с). Планета обращается вокруг красного карлика на расстоянии около 18 световых лет от Земли и считается одним из самых перспективных кандидатов для поисков жизни.

13 октября, 11:10
Илья Гриднев

Согласно новой гипотезе, сознание возникает не только из-за активности нейронов, но и благодаря физическим процессам — электромагнитным полям от движения жидкости в мозге. Эта модель, как и ее предшественники, пока носит теоретический характер, но предлагает нестандартный взгляд на проблему синхронизации работы разных отделов мозга.

24 октября, 14:02
РТУ МИРЭА

В современном доме, насыщенном разнообразной техникой, удлинители стали незаменимым атрибутом, позволяющим обеспечить электропитанием все необходимые устройства. Однако мало кто задумывается, что привычное использование этого аксессуара может нести серьезную угрозу безопасности. По статистике, значительная часть бытовых пожаров происходит из-за неправильной эксплуатации электропроводки и вспомогательных устройств. Какие приборы категорически нельзя подключать через удлинители и почему это может привести к трагическим последствиям, рассказывает профессор кафедры наноэлектроники РТУ МИРЭА, доктор физико-математических наук Алексей Юрасов.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно