• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
05.12.2024, 15:12
Редакция Naked Science
15,5 тыс

Российские ученые создали первую в мире открытую виртуальную среду для самообучающегося ИИ

❋ 4.9

Разработка называется XLand-MiniGrid и позволяет тренируемому ИИ выполнять триллион взаимодействий с обучающей его средой всего за три дня.

Автомобили Waymo бибикают друг на друга ночью на парковке в США, 2024 год. Жители окрестных домов были не в восторге: автономные авто сами слабо реагируют на звуковые сигналы, поэтому перекличка шла долго. Для решения подобных проблем нужен более гибкий ИИ / © Wikimedia Commons

Хотя СМИ часто представляют эволюцию современного ИИ как непрерывную историю успеха, реальность заметно сложнее. Управление автономными автомобилями и БЛА остается проблемой: даже у самых сильных игроков отрасли вроде Waymo и Tesla машины периодически едут на красный свет или сигналят друг другу по ночам, несмотря на тот факт, что автономный автомобиль, в отличие от пилотируемого, практически не реагирует на звуковые сигналы.

Подобные истории неслучайны, но указывают на одно из узких мест современного ИИ: он неплохо работает в ситуациях, к которым его «готовили», обучая на большой выборке, но часто пасует перед редко встречающимися сложностями, которые лишь слабо (а то и вообще никак) представлены в его обучающей выборке.

Разумеется, ученые пытаются бороться с такими явлениями. Одно из средств — контекстное обучение с подкреплением (In-context Reinforcement Learning, или In-Context RL). Речь идет о сравнительно новом направлении в ИИ: такой подход позволяет модели быстро адаптироваться к новым задачам, отталкиваясь от подсказок и контекста, без длительного обучения с нуля.

В результате ИИ может эффективно взаимодействовать даже с весьма сложной окружающей средой и дообучаться на лету. In-Context RL считается перспективным в таких областях, как персонализированные рекомендации для покупателей интернет-магазинов, управление роботами и автономными автомобилями. Иными словам он востребованнее всего там, где требуется практически мгновенная адаптация к принципиально новым условиям.

Но для обучения такого ИИ нужны специальная виртуальная среда, своего рода цифровой полигон. Имеющиеся среды такого рода можно разделить на две категории. Одни неплохо разработаны, как Google DeepMind, но внутрикорпоративны, то есть закрыты для внешних пользователей. Второй вариант: они открыты, но сравнительно просты, поэтому предлагают для дообучения ИИ лишь однотипные и легкие задачи. На них добиться существенного прогресса проблематично. Поэтому в лаборатории T-Bank AI Research решили создать свою собственную открытую виртуальную среду.

«Мы пришли в область контекстного обучения с подкреплением, когда она еще зарождалась, поэтому не нашли ни одного подходящего инструмента для оценки новых идей. Стало понятно, что это проблема для многих специалистов, а значит, она должна быть решена одной из первых. Поэтому появился XLand-MiniGrid», — отметил ученый Вячеслав Синий из научной группы AI Alignment, входящей в лабораторию исследований искусственного интеллекта T-Bank AI Research.

Научная статья о новой виртуальной среде принята на крупнейшую международную конференцию в области ИИ — NeurIPS 2024. Ее представят там с 10 по 15 декабря в Ванкувере, Канада. Но еще до этого среду уже использовали в целом ряде исследований ученых из крупных зарубежных центров, разрабатывающих искусственный интеллект.

Новую среду создали на базе JAX — технологии для разработки высокопроизводительных программ. Поэтому, в отличие от более медленных открытых аналогов, XLand-MiniGrid выполняет миллиарды операций в секунду.

XLand-MiniGrid позволяет агентам совершать до одного триллиона взаимодействий со средой за три дня, что ускоряет эксперименты и проверку гипотез / © T-Bank AI Research

Еще там собрано 100 миллиардов примеров действий ИИ в 30 тысячах задач. За счет этого разработчики могут использовать готовые датасеты для обучения, а а не собирать их каждый раз с нуля. Такие особенности виртуальной среды для обучения ИИ упрощают исследования и новые открытия в этой области.

При этом, в отличие от уже существующих сред высокой сложности, XLand-MiniGrid находится в открытом доступе и выложена на GitHub.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
18 апреля, 12:33
Татьяна Зайцева

За последние 10 тысяч лет направленный естественный отбор способствовал эволюции почти 500 генов в ДНК жителей Западной Евразии, что повлияло на их внешний вид и восприимчивость к различным заболеваниям, установили авторы нового исследования.

20 апреля, 08:20
Любовь С.

Ветер на спутнике Сатурна Титане способен поднимать огромные волны, даже если он очень слабый. Эти волны формируют берега, переносят осадки, перемешивают жидкости и даже влияют на климат луны. Изучая их, планетологи могут понять, как устроены потенциально обитаемые миры за пределами Земли.

19 апреля, 13:23
Любовь С.

Ученые впервые подробно изучили состав самых дальних колец Урана. Выяснилось, что одно из них похоже на ледяное облако пыли, а другое богато органикой. Открытие помогает восстановить историю столкновений спутников и показывает, как именно формируются пылевые системы вокруг планет.

18 апреля, 12:33
Татьяна Зайцева

За последние 10 тысяч лет направленный естественный отбор способствовал эволюции почти 500 генов в ДНК жителей Западной Евразии, что повлияло на их внешний вид и восприимчивость к различным заболеваниям, установили авторы нового исследования.

18 апреля, 10:00
Evgenia Vavilova

Ученые продолжают исследовать фундаментальные частицы на неделимость. На этот раз на БАК исследовали кварки и не нашли у них признаков составной частицы.

17 апреля, 08:20
Любовь С.

Что, если развитые цивилизации во Вселенной не исчезают навсегда, а периодически «выключаются», переживая циклы коллапсов и восстановлений? Модель, разработанная авторами нового исследования, показывает, что такая прерывистая жизнь может объяснить космическую тишину — и переосмыслить будущее Земли.

5 апреля, 15:48
Александр Березин

Четыре человека, летящие к Луне, столкнулись с целым рядом мелких неприятностей — от низкой температуры в начале работы до поломки мочевыводящей системы туалета на вторые сутки и необходимости взамен пользоваться пакетами. К счастью, пока самые крупные сложности удалось компенсировать. Но все они вместе могут сдвинуть ситуацию к решению, о котором Naked Science уже говорил в нашем видеоподкасте о миссии: не исключено, что при высадке астронавтов на Луне их корабль состыкуют со Starship не на окололунной, а уже на околоземной орбите.

10 апреля, 10:51
Татьяна Зайцева

Когда международная экспедиционная группа, исследующая море Уэдделла в Антарктиде на борту ледокола «Поларштерн», попыталась укрыться от шторма, ученые и экипаж судна удивились внезапному появлению острова, не обозначенного ни на одной морской карте.

9 апреля, 08:30
Максим Абдулаев

Окаменелые остатки рептилии возрастом 289 миллионов лет сохранили полное анатомическое устройство грудной клетки ранних покорителей суши. Благодаря нетронутым хрящам исследователи реконструировали механику первого полноценного реберного дыхания. Наличие в тканях оригинальных белков подтвердило, что сложные органические молекулы способны сохраняться в палеонтологической летописи почти на 100 миллионов лет дольше, чем считалось.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Комментарий на проверке

Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно