Искусственный интеллект DeepMind победил людей в кооперативной игре Quake III Arena
Агенты нейросети тренировались на тысячах игр одновременно, проведя около 450 тысяч матчей.
Сотрудники британской компании DeepMind, которая с 2014 года принадлежит Google, опубликовали статью в журнале Science, посвященную успехам их искусственного интеллекта. На этот раз они смогли натренировать алгоритм на командную игру в режиме «Захват флага» мультиплеерного шутера Quake III Arena. Команда из агентов ИИ в подавляющем количестве игр победила команду людей.
Для тренировки агентов специалисты использовали обучение с подкреплением — метод машинного обучения, при котором система учится, взаимодействуя со средой. Авторы статьи пишут, что этот метод успешно зарекомендовал себя в обучении одного агента, но они хотели узнать, насколько он успешен при командной работе.
В качестве платформы они выбрали мультиплеерный шутер от первого лица Quake III Arena, но задали свои условия игры. Во-первых, карты каждый раз генерируются случайно. Во-вторых, в матче принимают участие только четыре игрока: по два с каждой стороны. Соревнование проходит только в одном режиме — «Захват флага»: каждая из команд должна одновременно защитить свой флаг, захватить флаг оппонентов и принести на свою базу. Реакцию системы снизили до средних показателей человека.
Авторы тренировали 30 агентов. Тренировка происходила благодаря многотысячным параллельным партиям, которые отыгрывали агенты. При этом каждый агент представлял собой индивидуальную единицу, которая действует самостоятельно, исходя из обучения с подкреплением. Специалисты также демонстрируют филогенетическое дерево, которое строится в ходе этого обучения.
После тренировок алгоритмы сыграли несколько партий с командой людей. Обе команды играли на неизвестных для них картах. Пара агентов за игру в среднем захватывала на 16 флагов больше, чем пара людей. Только когда человек играл в партнерстве с искусственным интеллектом, ему удавалось выиграть у объединения алгоритмов (5% вероятности победы).
Профессор Технологического колледжа Джорджии Марк Ридл (Mark Riedl) раскритиковал такой подход британской фирмы, сказав, что агенты не обмениваются сообщениями, а лишь реагируют на те события, которые происходят в игре. Однако представитель DeepMind Макс Джадерберг (Max Jaderberg) возразил:
«[В нашей симуляции] один из агентов сидит в лагере противника, ожидая, когда вновь появится флаг, это возможно только потому, что он полагается на своего партнера по команде».
Джадерберг говорит об одной из тактик искусственного интеллекта, выработанной тем в ходе обучения, которая предполагает ожидание появления нового флага в лагере оппонента. Ее часто используют и люди.
В январе DeepMind сообщила, что ее искусственный интеллект AlphaStar одолел двух профессиональных игроков в стратегию StarCraft II, проходящую в реальном времени.
Исследователи из МИЭМ ВШЭ и ИПКОН РАН разработали новую математическую модель мониторинга, которая позволяет фиксировать источник опасных подземных вибраций в реальном времени. Технология поможет снизить риск повреждения зданий, дорог и другой инфраструктуры рядом с карьерами и шахтами.
Планетологи обнаружили на поверхностях Титана и Плутона схожую полосу поглощения, которая не совпадает со спектрами известных льдов или органических соединений. Этот загадочный «провал» может указывать на то, что на двух очень разных ледяных мирах Солнечной системы существует общий, пока неизвестный науке класс химических веществ, поглощающий свет, который формируется под действием экстремального холода и космической радиации.
На севере Австралии живет паук с весьма необычными охотничьими повадками. Он возводит «конструкцию», которая работает как древнее метательное оружие. Добыча взлетает над землей, а потом запутывается в паучьей сети. Такая тактика охоты, по-видимому, применяется лишь по отношению к конкретному виду муравьев.
Паразитические организмы иногда не учитывают, что сами могут оказаться целью паразита более высокого уровня. Сосредотачивая все свои силы на инфицировании и размножении, они остаются беззащитными перед агрессивным специализированным нахлебником.
Интригующие испытания высотного ракетного двигателя Raptor Vacuum для корабля Starship, верхней ступени сверхракеты Илона Маска, парадоксальны. Его работа на уровне моря уже сама по себе загадка. Ведь, по классическим представлениям, высотные двигатели на уровне моря корректно не работают. А сопло RaptorVAC на наземном стенде извергает реактивную струю без всяких признаков нарушения работы. Как такое может быть?
В нижних и верхних слоях Урана астрономы впервые зарегистрировали угарный газ и циановодород. Новые данные указали на то, что недра планеты могут быть значительно обогащены кислородом. Это открытие поможет разрешить давнюю загадку о том, сформировался ли Уран иначе, чем его ближайший сосед Нептун, или их образование шло по схожему сценарию.
Хотя длительность помех не превышала десяти секунд, это первый известный случай такого рода. Обычно спутникам не хватает мощности для создания радиосигналов той силы, что нужна для подобных помех.
В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.
Вначале Reuters опубликовал статью о взаимоотношениях SpaceX и Пентагона, которую миллиардер --- традиционно для его отношений с этим изданием — назвал фейком. Опровергая ее тезисы, он обнародовал информацию, не представленную ранее публично.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Последние комментарии