Гибридная нейросеть превзошла человека в Ms. Pac-Man — Naked Science
15.06.2017
Редакция

Гибридная нейросеть превзошла человека в Ms. Pac-Man

Канадская компания Maluuba разработала компьютерный алгоритм, который установил новый рекорд в аркадной игре Ms. Pac-Man.

317161236_d9a9bcee04_o
©Wikipedia

Развитие технологий машинного обучения вызывает интерес к выявлению предела «когнитивных» способностей существующих компьютерных алгоритмов. С этой целью нередко используются виртуальные игры. Так, в апреле международная группа ученых представила искусственную нейронную сеть, которая самостоятельно освоила тактики игры в StarCraft, характерные для профессиональных геймеров. Значительно чаще в тренировках машин задействуются видеоприставки, например Atari 2600. Несмотря на сравнительно простой интерфейс и, как правило, линейность процесса, такие игры могут предполагать сложную механику.

 

В рамках новой работы специалисты из Maluuba (принадлежит Microsoft) испытали новый алгоритм на игре Mr. Pac-Man для Atari 2600. После выпуска в 1982 году она получила широкое распространение в американских аркадных автоматах. В отличие от оригинального Pac-Man, вышедшего двумя годами ранее, главным героем Mr. Pac-Man выступало существо женского пола. Помимо звуковых и визуальных нововведений новая версия предусматривала изменения игровой механики, например отныне поведение призраков, которых необходимо избегать, было более спонтанным, а фрукты, пополняющие очки, двигались по лабиринту.

 

Вместо одной искусственной нейросети на этапе тренировок исследователи использовали более 150 агентов, каждый из которых осваивал эффективное решение одного типа задач, в частности захват определенных точек или уклонение от призраков. Затем авторы создали главный алгоритм, интегрировавший информацию от агентов. В ходе испытаний последний оценивал число агентов, ориентированных в том или ином направлении лабиринта, и их вес. Так, если большинство агентов предпочитали траекторию, которая позволяла съесть точки, а меньшинство стремилось избежать призраков, система предпочитала второе.

 

В результате тестов новый алгоритм сумел набрать 999 990 очков, что является максимально возможным значением и превышает предыдущий рекорд. По информации портала High Score, до сих пор лидерство по этому показателю сохранял пользователь под ником oyamafamily: в 2015 году он набрал в Ms. Pac-Man 266 330 очков. На этапе тренировок ученые применяли обучение с подкреплением — классический метод машинного обучения, предусматривающий воздействие на агентов откликов среды по типу обратной связи. Подход, предложенный Maluuba, получил название «гибридной системы подкрепления» (Hybrid Reward Architecture, HRA).

 

По мнению разработчиков, описанная техника может использоваться при создании алгоритмов, способных принимать решения для выполнения сложных работ. В будущем это может ускорить автоматизацию всех сфер жизни. О том, когда искусственный интеллект заменит человека, читайте в нашем материале.

 

О результатах испытаний сообщается в блоге Microsoft.

 

Ранее студенты Стэнфордского университета успешно обучили искусственную нейросеть игре «Месть Монтесумы» с помощью языковых инструкций.

 

Принцип работы нейросети / ©Microsoft

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Вчера, 14:06
Мария Азарова

Член Северо-Западной организации Федерации космонавтики России Александр Хохлов рассказал о проблемах, сопровождающих модуль «Наука» на пути к МКС, и объяснил, почему на долгожданную стыковку будет всего одна попытка.

Вчера, 15:26
Василий Парфенов

Компания Microsoft несколько лет назад намеревалась не изменять номер своей основной операционной системы для компьютеров — «десятка» должна была остаться с нами надолго. Однако очередное крупное обновление, по мнению маркетологов, очевидно, оказалось достойно новой цифры в названии ОС. Windows 11 принесет пользователям не только новые функции, улучшения безопасности и быстродействия, а также измененный дизайн, но и лишится некоторых привычных элементов. Хотя если кто-то и расстроится из-за этого, то скучать будет лишь по парочке из них.

Позавчера, 09:28
Сергей Васильев

Окаменелости возрастом более 3,4 миллиарда лет могут быть остатками микробов-архей, живших и выделявших метан у гидротермальных источников на дне ископаемого моря.

25 июля
Александр Березин

До массовой термоядерной энергетики 20 лет — и всегда будет 20 лет. Это незатейливая шутка сама стала старой еще 20 лет назад. Общество расстраивается от того, что термояд все никак не могут вывести на промышленный уровень. И лишь Илон Маск считает, что термоядерный реактор вовсе не нужен. Внимательный анализ показывает, что он прав. Даже если все технические проблемы термоядерной энергетики чудесным образом разрешатся, у нее не будет шансов вытеснить конкурентов. Как так вышло, и что тогда спасет человечество от энергетического кризиса?

25 июля
Мария Азарова

Ученые подтвердили связь между коронавирусной инфекцией и снижением когнитивных способностей на основе анализа данных более чем 81 тысячи человек.

Позавчера, 09:28
Сергей Васильев

Окаменелости возрастом более 3,4 миллиарда лет могут быть остатками микробов-архей, живших и выделявших метан у гидротермальных источников на дне ископаемого моря.

25 июля
Александр Березин

До массовой термоядерной энергетики 20 лет — и всегда будет 20 лет. Это незатейливая шутка сама стала старой еще 20 лет назад. Общество расстраивается от того, что термояд все никак не могут вывести на промышленный уровень. И лишь Илон Маск считает, что термоядерный реактор вовсе не нужен. Внимательный анализ показывает, что он прав. Даже если все технические проблемы термоядерной энергетики чудесным образом разрешатся, у нее не будет шансов вытеснить конкурентов. Как так вышло, и что тогда спасет человечество от энергетического кризиса?

13 июля
Ольга Иванова

Международная команда ученых идентифицировала ДНК из почвы в грузинской пещере. Благодаря этому исследователям удалось восстановить геном человека возрастом 25 тысяч лет, не имея никаких скелетных останков.

8 июля
Василий Парфенов

Подросток из бельгийского города Остенде стал вторым самым юным обладателем высшего образования в обозримой истории. Он с отличием окончил курс физики в Антверпенском университете и теперь собирается защитить магистерскую степень, а затем и докторскую диссертацию в этой области. Цель у него простая и понятная: увеличение продолжительности жизни человека вплоть до полного бессмертия за счет замены частей тела и органов механическими или искусственными.

[miniorange_social_login]

Комментарии

Написать комментарий

Подтвердить?
Подтвердить?
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: