26.04.2017, 15:12

Редакция Naked Science

Нейросеть освоила видеоигру по языковому гайду

Студенты Стэнфордского университета разработали компьютерный алгоритм, который обучили проходить видеоигру посредством простых команд на английском языке.

Технологии

# видеоигра

# нейросеть

# обучение

©Wikipedia / Автор: Ольга Кузьмина

В большинстве случаев при обучении искусственных нейросетей прохождению видеоигр используются алгоритмы с подкреплением — этот метод предполагает получение компьютером внешней обратной связи о своих действиях, например в виде зарабатывания очков. В процессе тренировок система совершает произвольные действия до получения вознаграждения, после чего стремится повторить «выгодный» шаблон. Авторы новой работы при обучении нейросети применили альтернативный подход, позволивший ей освоить одну из сложнейших видеоигр для приставки Atari 2600 — «Месть Монтесумы» (Montezuma’s Revenge). Из-за специфики геймплея она не впервые участвует в экспериментах с искусственным интеллектом: в этой игре редко встречаются положительные и доступные для оценки стимулы, такие как ключ для отпирания двери.

Чтобы упростить тренировку нейросети при прохождении игры с недостатком источников подкрепления, на первом этапе студенты обучили систему распознаванию команд на естественном языке, при этом фразы сопровождались скриншотом целевого действия игрового персонажа. Затем они передали алгоритму набор команд для прохождения каждой локации и позволили самостоятельно практиковаться. В рамках демонстрации авторы описали прохождение нейросетью комнаты с последовательностью команд типа «поднимись по лестнице» без доступа к данным о прошлых этапах обучения — это имитировало ситуацию первичного ознакомления с комнатой. Результаты показали, что искусственный интеллект верно интерпретировал команды и даже игнорировал некоторые из них при условии, что существует более оптимальная стратегия прохождения.

Пример последовательности языковых команд / ©Russell Kaplan et al., arXiv.org, 2017

Эффективность предложенного подхода студенты оценили с помощью платформы для проектирования и сравнения алгоритмов обучения с подкреплением OpenAI Gym. Согласно сопоставлению, представленная нейросеть за время прохождения Montezuma’s Revenge набрала 3500 очков, тогда как показатель ближайшего конкурента составил 2500 очков. Тем не менее, максимальное значение по-прежнему остается за алгоритмом Google DeepMind — 6600 очков, — хотя обучение последнего потребовало двое больше времени. В последующем авторы статьи намерены сократить количество инструкций на естественном языке, необходимых для освоения нейросетями видеоигр, с тем чтобы сделать их более независимыми.

Подробности работы представлены на сервере препринтов arXiv.org.

Ранее международная группа исследователей представила компьютерную программу, которая самостоятельно научилась сложным тактикам игры в StarCraft. Так, система освоила тактику «Ударил-убежал», атаку прикрывающим огнем и сосредоточенный огонь по отдельным целям малыми группами. По мнению исследователей, алгоритм оптимально подходит для взаимодействия и тренировки с несколькими агентами.

Видеозапись прохождения / ©Christopher Sauer

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Технологии

# видеоигра

# нейросеть

# обучение

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Органическая химия азота для медицины и освоения космоса

Космонавтика и авиация

Москва

Лекция

13 Июл

Бесплатно

Насколько огромна Вселенная?

Космонавтика и авиация

Москва

Лекция

13 Июл

Бесплатно

Культура и быт советской эпохи: 1970–1980-е годы — Застой и перестройка

ВДНХ

Москва

Лекция

13 Июл

Бесплатно

Что было до трилобитов: как появились членистоногие

Библиотека им. Маяковского

Санкт-Петербург

Лекция

13 Июл

1200 ₽

Как молекула стала живой

Medio Modo

Санкт-Петербург

Лекция

14 Июл

Бесплатно

Проблематики: кто ты, древний незнакомец?

Центр «Архэ»

Онлайн

Лекция

15 Июл

Бесплатно

Мы зря выделяли суффиксы

Библиотека им. Н. А. Некрасова

Москва

Экскурсия

15 Июл

500 ₽

«Союз» — «Аполлон» — рукопожатие в космосе

Политехнический музей

Москва

Лекция

15 Июл

Бесплатно

Хрустальные ночи Арктики: судьбы ледоколов и свет звезд

Библиотека Планетарий 1

Санкт-Петербург

Популярное

За сутки

За неделю

За месяц

11 июля, 17:47

Денис Яковлев

Ученые определили оптимальную длительность физической активности, которая продлевает жизнь на треть

Международная команда ученых оценила связь между длительностью физической активности, ее интенсивностью, риском смерти от всех причин и вероятностью развития сердечно-сосудистых и онкологических заболеваний.

Медицина

# ЗОЖ

# онкологические заболевания

# сердечно-сосудистые болезни

# смертность

# спорт

12 июля, 09:23

Александр Березин

Гусеницы восковой моли превратили полиэтилен в жир и пострадали от этого

Исследователи разобрались с тем, что происходит в организме пластикоядных гусениц при поедании и переваривании самого распространенного пластика. Оказалось, что для их здоровья это не проходит бесследно, но, похоже, есть способ помочь и гусеницам, и осуществляемому ими процессу разрушения искусственных полимеров.

Биология

# биология

# гусеницы

# пластик

10 июля, 13:16

ФизТех

Скрутить в кольцо и сломать позвоночник: ученые узнали, как крестьяне наказывали конокрадов в царской России

Кража лошадей была серьезной проблемой для крестьянских хозяйств в Российской империи. Особенности этого явления, включающие жестокие уголовные наказания, крестьянский самосуд и межэтнические конфликты, выявили в ходе исследования юридических источников историки из МФТИ и РЭУ имени Г.В. Плеханова.

ФизТех

# воровство

# крестьяне

# лошади

# Россия

8 июля, 09:23

Полина Меньшова

Люди с высоким уровнем интеллекта оказались менее нравственными

Принято считать, что люди с развитыми когнитивными способностями отличаются высокими моральными принципами. Ученые из Великобритании решили проверить этот тезис научными методами и пришли к противоположному выводу.

Психология

# интеллект

# мораль

# нравственность

# показатель IQ

9 июля, 08:26

Полина Меньшова

Предпочтения в спорте связали с типом личности

Подобрать тип физической активности, который лучше всего подходит человеку, можно исходя из особенностей его характера. Психологи из Великобритании определили, что люди с разными чертами личности получают больше удовольствия от разных видов спорта.

Психология

# спорт

# тип личности

# фитнес

# характер

# черты личности

9 июля, 12:05

Редакция Naked Science

За месяц «ВКонтакте» покинули больше миллиона авторов

В июне 2025 года ВК покинули 1,2 миллиона авторов контента. Это резкое ускорение их бегства в сравнении с предшествующими месяцами. Одновременно число авторов на других платформах растет, в результате по этому показателю соцсеть обогнал не только Telegram, но и запрещенный Instagram*. Причиной происходящего многие наблюдатели посчитали совокупность решений менеджмента компании за последние годы.

Медиа

# «ВКонтакте»

# медиа

# соцсети

17 июня, 16:49

Адель Романова

Давно отключенный спутник внезапно прислал «громкий» радиосигнал

Радиотелескопы уловили очень короткий сигнал, и по его характеристикам стало ясно, что он не может быть естественного происхождения. Астрономы пришли к выводу, что источник находился в околоземном пространстве — там, где уже более полувека летает «мертвый» аппарат NASA.

Астрономия

# космический мусор

# космос

# радиосигналы

# спутники

25 июня, 15:19

ФизТех

Российские ученые впервые точно определили источники шума сверхзвукового самолета с помощью суперкомпьютера

Группа российских ученых из Института прикладной математики имени М. В. Келдыша РАН и МФТИ провела детальное численное исследование источников шума, генерируемых крылом прототипа сверхзвукового бизнес-джета в режиме посадки. Эта работа, сочетающая передовые методы вычислительной гидродинамики и аэроакустики, впервые позволила с высокой точностью локализовать и охарактеризовать основные зоны шумообразования вблизи полноразмерной геометрии крыла модели прототипа сверхзвукового пассажирского самолета в посадочной конфигурации.

ФизТех

# «Суперджет»

# самолет

# сверхзвуковой

# суперкомпьютеры

# Шум

2 июля, 11:17

Юлия Тарасова

Коров покормили отходами конопли и проверили их молоко на психоактивность

Результаты эксперимента в США в будущем могут позволить добиться разрешения на использование отработанной конопли в качестве кормовой добавки в животноводстве.

Биология

# животноводство

# конопля

# корм

# коровы

# молоко

# ТГК

# тетрагидроканнабинол

[miniorange_social_login]

Нейросеть освоила видеоигру по языковому гайду

По теме

В НИУ ВШЭ научили нейросеть учиться на несколько порядков эффективнее

Новая система позволит генерировать тексты песен, которые повторяют стиль конкретных артистов

Видеоигры научили компьютер «мыслить» так, как мыслят школьники

Популярное

Комментарии

Последние новости:

Музыкальное образование улучшило качество жизни

У женщин с ПМС риск аритмии и инсульта оказался почти на треть выше

Гусеницы восковой моли превратили полиэтилен в жир и пострадали от этого

Ученые определили оптимальную длительность физической активности, которая продлевает жизнь на треть

Полет фантазии: заменит ли орбитальное базирование боеголовок современные МБР?

«Отвратительная тайна эволюции»: что стало известно о самом древнем цветке

Иран и Израиль — дойдет ли дело до ядерного оружия?

Трамп и Маск разругались: сорвет ли это высадку на Луну и как отразится на России?

Последние комментарии

Самые обсуждаемые

За месяц «ВКонтакте» покинули больше миллиона авторов

Люди с высоким уровнем интеллекта оказались менее нравственными

«Возродившая лютоволка» компания решила воскресить птицу моа

В продажу поступила первая настольная игра от Naked Science — «От моря до моря»