26.04.2017, 15:12

Редакция Naked Science

Нейросеть освоила видеоигру по языковому гайду

Студенты Стэнфордского университета разработали компьютерный алгоритм, который обучили проходить видеоигру посредством простых команд на английском языке.

Технологии

# видеоигра

# нейросеть

# обучение

©Wikipedia / Автор: Ольга Кузьмина

В большинстве случаев при обучении искусственных нейросетей прохождению видеоигр используются алгоритмы с подкреплением — этот метод предполагает получение компьютером внешней обратной связи о своих действиях, например в виде зарабатывания очков. В процессе тренировок система совершает произвольные действия до получения вознаграждения, после чего стремится повторить «выгодный» шаблон. Авторы новой работы при обучении нейросети применили альтернативный подход, позволивший ей освоить одну из сложнейших видеоигр для приставки Atari 2600 — «Месть Монтесумы» (Montezuma’s Revenge). Из-за специфики геймплея она не впервые участвует в экспериментах с искусственным интеллектом: в этой игре редко встречаются положительные и доступные для оценки стимулы, такие как ключ для отпирания двери.

Чтобы упростить тренировку нейросети при прохождении игры с недостатком источников подкрепления, на первом этапе студенты обучили систему распознаванию команд на естественном языке, при этом фразы сопровождались скриншотом целевого действия игрового персонажа. Затем они передали алгоритму набор команд для прохождения каждой локации и позволили самостоятельно практиковаться. В рамках демонстрации авторы описали прохождение нейросетью комнаты с последовательностью команд типа «поднимись по лестнице» без доступа к данным о прошлых этапах обучения — это имитировало ситуацию первичного ознакомления с комнатой. Результаты показали, что искусственный интеллект верно интерпретировал команды и даже игнорировал некоторые из них при условии, что существует более оптимальная стратегия прохождения.

Пример последовательности языковых команд / ©Russell Kaplan et al., arXiv.org, 2017

Эффективность предложенного подхода студенты оценили с помощью платформы для проектирования и сравнения алгоритмов обучения с подкреплением OpenAI Gym. Согласно сопоставлению, представленная нейросеть за время прохождения Montezuma’s Revenge набрала 3500 очков, тогда как показатель ближайшего конкурента составил 2500 очков. Тем не менее, максимальное значение по-прежнему остается за алгоритмом Google DeepMind — 6600 очков, — хотя обучение последнего потребовало двое больше времени. В последующем авторы статьи намерены сократить количество инструкций на естественном языке, необходимых для освоения нейросетями видеоигр, с тем чтобы сделать их более независимыми.

Подробности работы представлены на сервере препринтов arXiv.org.

Ранее международная группа исследователей представила компьютерную программу, которая самостоятельно научилась сложным тактикам игры в StarCraft. Так, система освоила тактику «Ударил-убежал», атаку прикрывающим огнем и сосредоточенный огонь по отдельным целям малыми группами. По мнению исследователей, алгоритм оптимально подходит для взаимодействия и тренировки с несколькими агентами.

Видеозапись прохождения / ©Christopher Sauer

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Технологии

# видеоигра

# нейросеть

# обучение

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Культура и традиции Замбии

Библиотека иностранной литературы

Москва

Лекция

18 Июл

Бесплатно

Восточные сокровища Лазаревского института в Москве

Российская государственная библиотека

Москва

Лекция

18 Июл

700 ₽

Биобезобразие. Куда исчезли пчелы и воробьи?

Ельцин Центр

Екатеринбург

Лекция

18 Июл

1100 ₽

Античные юмористы или над чем смеялись в Древнем Риме

Medio Modo

Москва

Лекция

18 Июл

Бесплатно

Роль музыки и танца в культуре Древнего Египта

Библиотека иностранной литературы

Москва

Лекция

18 Июл

Бесплатно

Электричество в живых организмах: как генерировать и использовать

Библиотека им. Н. А. Некрасова

Москва

Лекция

18 Июл

700 ₽

Пластики: когда они нас уже убьют?

Зануда

Санкт-Петербург

Лекция

19 Июл

Бесплатно

Как тирекс стал суперхищником?

Библиотека им. Маяковского

Санкт-Петербург

Лекция

19 Июл

Бесплатно

Солнце штормит: магнитные страсти XXI века

Русское географическое общество

Москва

Популярное

За сутки

За неделю

За месяц

17 июля, 18:11

Юлия Тарасова

Поведение собак при просмотре телевизора отразило особенности их характера

Новое исследование показало, что реакция псов на объекты и звуки с ТВ-экранов варьируется в зависимости от характера и психологических особенностей питомцев. По мнению специалистов, знание этих деталей может пригодиться при разработке коррекционных программ для собак с проблемным поведением.

Биология

# домашние питомцы

# зоопсихология

# поведение животных

# поведение собак

# собаки

# телевизор

17 июля, 14:41

Александр Березин

Ученый разрешил «запрещенную» жидкую воду на поверхности Марса

Полтора десятка лет назад студент из Непала открыл на снимках NASA потоки жидкой воды на четвертой планете. Большинство ученых отреагировало на это с серьезным скепсисом. Одна за одной выходили работы о том, что этого не может быть, ведь давление и температура там слишком низки. Но в новом исследовании показано, почему на самом деле жидкая вода возможна даже в марсианских условиях, то есть открытие потоков там вполне реально.

Астрономия

# Викинг-2

# внеземная вода

# марс

# марсианская вода

18 июля, 11:48

Юлия Тарасова

Эксперимент показал, под какую музыку лучше тренироваться

Не секрет, что занятия спортом под музыку приятнее и помогают повысить продуктивность тренировок. В новом исследовании итальянские ученые на примере силовых упражнений показали, какая именно музыка лучше подходит для таких целей.

Психология

# музыка

# силовые нагрузки

# спорт

# тренировки

# физические упражнения

12 июля, 22:10

Редакция Naked Science

Научно-фантастические сериалы лета, на которые стоит обратить внимание

Лето 2025 обещает насыщенную линейку научно-фантастических сериалов на ведущих стриминговых платформах. От адаптаций культовых романов до масштабных космических одиссей — мы отобрали проекты, на которые стоит обратить внимание.

Sci-Fi

# «Звездный путь»

# научная фантастика

# сериалы

15 июля, 12:45

ПНИПУ

Российские ученые заставили рацию работать без помех

В условиях отсутствия связи (шахты, горы, тайга) критически важна надежная передача данных. Ученые Пермского Политеха разработали цифровую радиостанцию, устойчивую к помехам и физическим препятствиям, включая бетонные стены. Устройство передает данные в двух сетях MANET одновременно, обеспечивая скорость до 300 кбит/с (низкоскоростной канал) и 54 Мбит/с (высокоскоростной). Рация работает как ретранслятор и узел сети, что делает ее незаменимой для спасателей, промышленности и туристов. Ключевые преимущества разработки: помехоустойчивость, дальность связи до 30 километров и работа при -25°C до +55 градусов Цельсия.

ПНИПУ

# МЧС

# помехи

# радиостанция

# Туризм

15 июля, 11:00

НИУ ВШЭ

ИИ определил родство точнее, чем тесты ДНК

В Институте искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ предложили новый подход, основанный на современных методах машинного обучения, для определения генетического происхождения человека. Графовые нейросети позволяют с высокой точностью различать даже очень близкие популяции.

НИУ ВШЭ

# ДНК

# мутации

# народы

# родственники

25 июня, 15:19

ФизТех

Российские ученые впервые точно определили источники шума сверхзвукового самолета с помощью суперкомпьютера

Группа российских ученых из Института прикладной математики имени М. В. Келдыша РАН и МФТИ провела детальное численное исследование источников шума, генерируемых крылом прототипа сверхзвукового бизнес-джета в режиме посадки. Эта работа, сочетающая передовые методы вычислительной гидродинамики и аэроакустики, впервые позволила с высокой точностью локализовать и охарактеризовать основные зоны шумообразования вблизи полноразмерной геометрии крыла модели прототипа сверхзвукового пассажирского самолета в посадочной конфигурации.

ФизТех

# «Суперджет»

# самолет

# сверхзвуковой

# суперкомпьютеры

# Шум

2 июля, 11:17

Юлия Тарасова

Коров покормили отходами конопли и проверили их молоко на психоактивность

Результаты эксперимента в США в будущем могут позволить добиться разрешения на использование отработанной конопли в качестве кормовой добавки в животноводстве.

Биология

# животноводство

# конопля

# корм

# коровы

# молоко

# ТГК

# тетрагидроканнабинол

12 июля, 22:10

Редакция Naked Science

Научно-фантастические сериалы лета, на которые стоит обратить внимание

Sci-Fi

# «Звездный путь»

# научная фантастика

# сериалы

[miniorange_social_login]

Нейросеть освоила видеоигру по языковому гайду

По теме

В НИУ ВШЭ научили нейросеть учиться на несколько порядков эффективнее

Новая система позволит генерировать тексты песен, которые повторяют стиль конкретных артистов

Видеоигры научили компьютер «мыслить» так, как мыслят школьники

Популярное

Комментарии

Последние новости:

Новый рентгеновский метод позволил впервые увидеть движение электронов

Россия и Узбекистан наладят сотрудничество в сфере научных исследований

Юрские рыбы регулярно гибли от попыток «обглодать» добычу размером с себя

Семь самых опасных растений в России, к которым ученые рекомендуют даже не приближаться

Полет фантазии: заменит ли орбитальное базирование боеголовок современные МБР?

«Отвратительная тайна эволюции»: что стало известно о самом древнем цветке

Иран и Израиль — дойдет ли дело до ядерного оружия?

Трамп и Маск разругались: сорвет ли это высадку на Луну и как отразится на России?

Последние комментарии

Самые обсуждаемые

Ученые определили оптимальную длительность физической активности, которая продлевает жизнь на треть

Гравитационный телескоп впервые зарегистрировал слияние черных дыр промежуточных масс

Научно-фантастические сериалы лета, на которые стоит обратить внимание

Нейросети замедлили работу программистов, а не помогли ускорить ее