Гибридная нейросеть превзошла человека в Ms. Pac-Man — Naked Science
15.06.2017
6 минут
Редакция

Гибридная нейросеть превзошла человека в Ms. Pac-Man

Канадская компания Maluuba разработала компьютерный алгоритм, который установил новый рекорд в аркадной игре Ms. Pac-Man.

317161236_d9a9bcee04_o

Развитие технологий машинного обучения вызывает интерес к выявлению предела «когнитивных» способностей существующих компьютерных алгоритмов. С этой целью нередко используются виртуальные игры. Так, в апреле международная группа ученых представила искусственную нейронную сеть, которая самостоятельно освоила тактики игры в StarCraft, характерные для профессиональных геймеров. Значительно чаще в тренировках машин задействуются видеоприставки, например Atari 2600. Несмотря на сравнительно простой интерфейс и, как правило, линейность процесса, такие игры могут предполагать сложную механику.

 

В рамках новой работы специалисты из Maluuba (принадлежит Microsoft) испытали новый алгоритм на игре Mr. Pac-Man для Atari 2600. После выпуска в 1982 году она получила широкое распространение в американских аркадных автоматах. В отличие от оригинального Pac-Man, вышедшего двумя годами ранее, главным героем Mr. Pac-Man выступало существо женского пола. Помимо звуковых и визуальных нововведений новая версия предусматривала изменения игровой механики, например отныне поведение призраков, которых необходимо избегать, было более спонтанным, а фрукты, пополняющие очки, двигались по лабиринту.

 

Вместо одной искусственной нейросети на этапе тренировок исследователи использовали более 150 агентов, каждый из которых осваивал эффективное решение одного типа задач, в частности захват определенных точек или уклонение от призраков. Затем авторы создали главный алгоритм, интегрировавший информацию от агентов. В ходе испытаний последний оценивал число агентов, ориентированных в том или ином направлении лабиринта, и их вес. Так, если большинство агентов предпочитали траекторию, которая позволяла съесть точки, а меньшинство стремилось избежать призраков, система предпочитала второе.

 

В результате тестов новый алгоритм сумел набрать 999 990 очков, что является максимально возможным значением и превышает предыдущий рекорд. По информации портала High Score, до сих пор лидерство по этому показателю сохранял пользователь под ником oyamafamily: в 2015 году он набрал в Ms. Pac-Man 266 330 очков. На этапе тренировок ученые применяли обучение с подкреплением — классический метод машинного обучения, предусматривающий воздействие на агентов откликов среды по типу обратной связи. Подход, предложенный Maluuba, получил название «гибридной системы подкрепления» (Hybrid Reward Architecture, HRA).

 

По мнению разработчиков, описанная техника может использоваться при создании алгоритмов, способных принимать решения для выполнения сложных работ. В будущем это может ускорить автоматизацию всех сфер жизни. О том, когда искусственный интеллект заменит человека, читайте в нашем материале.

 

О результатах испытаний сообщается в блоге Microsoft.

 

Ранее студенты Стэнфордского университета успешно обучили искусственную нейросеть игре «Месть Монтесумы» с помощью языковых инструкций.

 

Принцип работы нейросети / ©Microsoft

Вчера, 11:57
6 минут
Никита Шевцов

Ученые впервые воспроизвели в реальности парадокс друга Вигнера. В результате физики выяснили, что квантовые явления субъективны: каждый наблюдатель может иметь свои альтернативные факты насчет них, и все они будут правдивы.

Вчера, 15:31
4 минуты
Илья Ведмеденко

По оценкам американских специалистов, одно место на пилотируемой версии корабля Dragon стоит 55 миллионов долларов. Это намного дешевле стоимости одного места на аппаратах серии «Союз».

Позавчера, 16:28
4 минуты
Никита Шевцов

Австрийские ученые обнаружили в образцах биологических жидкостей людей новый вид бактериофагов — вирусов, поражающих бактерии.

Вчера, 11:57
6 минут
Никита Шевцов

Ученые впервые воспроизвели в реальности парадокс друга Вигнера. В результате физики выяснили, что квантовые явления субъективны: каждый наблюдатель может иметь свои альтернативные факты насчет них, и все они будут правдивы.

12 ноября
4 минуты
Никита Шевцов

Ученые использовали современные методы анализа и создали тест, который может определить, принимал ли человек наркотики, даже после того, как он тщательно вымыл руки.

13 ноября
18 минут
Александр Березин

Гибель десятков человек от вейпинга объяснили витамином Е. Попробуем разобраться в странной истории о массовой болезни молодых вейперов.

Вчера, 11:57
6 минут
Никита Шевцов

Ученые впервые воспроизвели в реальности парадокс друга Вигнера. В результате физики выяснили, что квантовые явления субъективны: каждый наблюдатель может иметь свои альтернативные факты насчет них, и все они будут правдивы.

12 ноября
4 минуты
Никита Шевцов

Ученые использовали современные методы анализа и создали тест, который может определить, принимал ли человек наркотики, даже после того, как он тщательно вымыл руки.

13 ноября
18 минут
Александр Березин

Гибель десятков человек от вейпинга объяснили витамином Е. Попробуем разобраться в странной истории о массовой болезни молодых вейперов.

[miniorange_social_login]

Комментарии

Написать комментарий

Подтвердить?
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: