• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
05.12.2024, 15:12
Редакция Naked Science
15,5 тыс

Российские ученые создали первую в мире открытую виртуальную среду для самообучающегося ИИ

❋ 4.9

Разработка называется XLand-MiniGrid и позволяет тренируемому ИИ выполнять триллион взаимодействий с обучающей его средой всего за три дня.

Автомобили Waymo бибикают друг на друга ночью на парковке в США, 2024 год. Жители окрестных домов были не в восторге: автономные авто сами слабо реагируют на звуковые сигналы, поэтому перекличка шла долго. Для решения подобных проблем нужен более гибкий ИИ / © Wikimedia Commons

Хотя СМИ часто представляют эволюцию современного ИИ как непрерывную историю успеха, реальность заметно сложнее. Управление автономными автомобилями и БЛА остается проблемой: даже у самых сильных игроков отрасли вроде Waymo и Tesla машины периодически едут на красный свет или сигналят друг другу по ночам, несмотря на тот факт, что автономный автомобиль, в отличие от пилотируемого, практически не реагирует на звуковые сигналы.

Подобные истории неслучайны, но указывают на одно из узких мест современного ИИ: он неплохо работает в ситуациях, к которым его «готовили», обучая на большой выборке, но часто пасует перед редко встречающимися сложностями, которые лишь слабо (а то и вообще никак) представлены в его обучающей выборке.

Разумеется, ученые пытаются бороться с такими явлениями. Одно из средств — контекстное обучение с подкреплением (In-context Reinforcement Learning, или In-Context RL). Речь идет о сравнительно новом направлении в ИИ: такой подход позволяет модели быстро адаптироваться к новым задачам, отталкиваясь от подсказок и контекста, без длительного обучения с нуля.

В результате ИИ может эффективно взаимодействовать даже с весьма сложной окружающей средой и дообучаться на лету. In-Context RL считается перспективным в таких областях, как персонализированные рекомендации для покупателей интернет-магазинов, управление роботами и автономными автомобилями. Иными словам он востребованнее всего там, где требуется практически мгновенная адаптация к принципиально новым условиям.

Но для обучения такого ИИ нужны специальная виртуальная среда, своего рода цифровой полигон. Имеющиеся среды такого рода можно разделить на две категории. Одни неплохо разработаны, как Google DeepMind, но внутрикорпоративны, то есть закрыты для внешних пользователей. Второй вариант: они открыты, но сравнительно просты, поэтому предлагают для дообучения ИИ лишь однотипные и легкие задачи. На них добиться существенного прогресса проблематично. Поэтому в лаборатории T-Bank AI Research решили создать свою собственную открытую виртуальную среду.

«Мы пришли в область контекстного обучения с подкреплением, когда она еще зарождалась, поэтому не нашли ни одного подходящего инструмента для оценки новых идей. Стало понятно, что это проблема для многих специалистов, а значит, она должна быть решена одной из первых. Поэтому появился XLand-MiniGrid», — отметил ученый Вячеслав Синий из научной группы AI Alignment, входящей в лабораторию исследований искусственного интеллекта T-Bank AI Research.

Научная статья о новой виртуальной среде принята на крупнейшую международную конференцию в области ИИ — NeurIPS 2024. Ее представят там с 10 по 15 декабря в Ванкувере, Канада. Но еще до этого среду уже использовали в целом ряде исследований ученых из крупных зарубежных центров, разрабатывающих искусственный интеллект.

Новую среду создали на базе JAX — технологии для разработки высокопроизводительных программ. Поэтому, в отличие от более медленных открытых аналогов, XLand-MiniGrid выполняет миллиарды операций в секунду.

XLand-MiniGrid позволяет агентам совершать до одного триллиона взаимодействий со средой за три дня, что ускоряет эксперименты и проверку гипотез / © T-Bank AI Research

Еще там собрано 100 миллиардов примеров действий ИИ в 30 тысячах задач. За счет этого разработчики могут использовать готовые датасеты для обучения, а а не собирать их каждый раз с нуля. Такие особенности виртуальной среды для обучения ИИ упрощают исследования и новые открытия в этой области.

При этом, в отличие от уже существующих сред высокой сложности, XLand-MiniGrid находится в открытом доступе и выложена на GitHub.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
1 июля, 11:54
Марк Чернов

Древнеримские инженеры проложили колоссальную сеть дорог через Европу, Северную Африку и Ближний Восток, многие участки которой до сих пор поражают безупречной прямолинейностью. Секрет строительства заключался в использовании трех особых геодезических инструментов, с помощью которых разбивали местность на ровные отрезки и размечали трассы.

3 июля, 12:20
Татьяна Зайцева

Японские исследователи выловили у берегов Окинавы пластиковую бутылку с узким горлышком, внутри которой сидел большой живой краб. В итоге ученые смогли найти ответы на несколько возникших в связи с этой находкой вопросов: как краб попал в бутылку, сколько там находился и как ему удалось выжить?

3 июля, 08:40
Любовь С.

Если достаточно развитая цивилизация может отправлять к звездам не колонистов, а крошечные автономные зонды с ИИ, роботами и архивами знаний, то молчание Вселенной становится еще более странным. Возможно, развитые цивилизации не строят космические империи и не окружают звезды мегаструктурами, а расселяются по Галактике тихо — с помощью малозаметных автоматических систем.

1 июля, 11:54
Марк Чернов

Древнеримские инженеры проложили колоссальную сеть дорог через Европу, Северную Африку и Ближний Восток, многие участки которой до сих пор поражают безупречной прямолинейностью. Секрет строительства заключался в использовании трех особых геодезических инструментов, с помощью которых разбивали местность на ровные отрезки и размечали трассы.

30 июня, 16:52
Понамарева Валерия

Самый маленький дневной хищник Африки впервые попал под наблюдение с помощью GPS-трекеров. Ученые выяснили, что для выкармливания птенцов ему нужен участок почти в 14 раз меньше, чем у степной пустельги — ближайшего «рекордсмена» среди изученных птиц.

28 июня, 16:58
Alexander Baulin

Терраформировать Марс — то есть превратить в мир, где можно жить без защитных куполов — мечта человечества с того момента, как стало понятно, что это холодная планета с призрачной бескислородной атмосферой. Сейчас главный хедлайнер ее освоения — Илон Маск, компания SpaceX которого планирует первые полеты туда уже в 2028 году. Многие энтузиасты вспоминают слова Маска 14-летней давности: Красную планету надо лишь «подремонтировать», чтобы ходить без скафандра. Но между полетом и прогулками по городу-саду на Марсе лежит огромная пропасть. Пару лет назад Naked Science рассматривал положительный сценарий терраформирования. Пришло время подсчитать, сколько же лет и ресурсов потребуется.

10 июня, 11:51
Александр Березин

Хотя длительность помех не превышала десяти секунд, это первый известный случай такого рода. Обычно спутникам не хватает мощности для создания радиосигналов той силы, что нужна для подобных помех.

25 июня, 16:20
Любовь С.

Вселенная может оказаться «замкнутой» глобальной структурой, где свет от далеких галактик способен возвращаться к наблюдателю с разных направлений. Именно такой сценарий не удалось исключить авторам нового масштабного обзора. Проверить его предсказания астрономы смогут уже в ближайшие годы.

25 июня, 15:09
Марк Чернов

Ученые впервые на молекулярном уровне доказали, что обычная вода одновременно состоит из двух разных жидких состояний — более плотного и менее плотного, которые непрерывно сменяют друг друга. Раз молекулярная «двойственность» действительно существует, это подтверждает спорную 30-летнюю гипотезу. Новое открытие поможет, наконец, объяснить десятки «странных» физических аномалий воды, включая ее расширение при замерзании и парадоксальное изменение вязкости под давлением.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Комментарий на проверке

Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Ошибка авторизации
По закону на российских сайтах теперь нельзя авторизовываться с помощью иностранных сервисов. Используйте другой способ или восстановите доступ по почте.
Восстановить доступ
Войти по-другому
Вход через почту
Введите привязанную к соцсети почту, чтобы восстановить доступ или получить одноразовую ссылку для входа на сайт.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно