• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
31.05.2019, 10:33
alex007
8
16,6 тыс

Искусственный интеллект DeepMind победил людей в кооперативной игре Quake III Arena

Агенты нейросети тренировались на тысячах игр одновременно, проведя около 450 тысяч матчей.

55
©Wikipedia / Автор: Sycophanta Duccius

Сотрудники британской компании DeepMind, которая с 2014 года принадлежит Google, опубликовали статью в журнале Science, посвященную успехам их искусственного интеллекта. На этот раз они смогли натренировать алгоритм на командную игру в режиме «Захват флага» мультиплеерного шутера Quake III Arena. Команда из агентов ИИ в подавляющем количестве игр победила команду людей.

 

Для тренировки агентов специалисты использовали обучение с подкреплением — метод машинного обучения, при котором система учится, взаимодействуя со средой. Авторы статьи пишут, что этот метод успешно зарекомендовал себя в обучении одного агента, но они хотели узнать, насколько он успешен при командной работе.

 

В качестве платформы они выбрали мультиплеерный шутер от первого лица Quake III Arena, но задали свои условия игры. Во-первых, карты каждый раз генерируются случайно. Во-вторых, в матче принимают участие только четыре игрока: по два с каждой стороны. Соревнование проходит только в одном режиме — «Захват флага»: каждая из команд должна одновременно защитить свой флаг, захватить флаг оппонентов и принести на свою базу. Реакцию системы снизили до средних показателей человека.

 

Авторы тренировали 30 агентов. Тренировка происходила благодаря многотысячным параллельным партиям, которые отыгрывали агенты. При этом каждый агент представлял собой индивидуальную единицу, которая действует самостоятельно, исходя из обучения с подкреплением. Специалисты также демонстрируют филогенетическое дерево, которое строится в ходе этого обучения.

 

Процесс обучения / ©Science

 

После тренировок алгоритмы сыграли несколько партий с командой людей. Обе команды играли на неизвестных для них картах. Пара агентов за игру в среднем захватывала на 16 флагов больше, чем пара людей. Только когда человек играл в партнерстве с искусственным интеллектом, ему удавалось выиграть у объединения алгоритмов (5% вероятности победы).

 

Профессор Технологического колледжа Джорджии Марк Ридл (Mark Riedl) раскритиковал такой подход британской фирмы, сказав, что агенты не обмениваются сообщениями, а лишь реагируют на те события, которые происходят в игре. Однако представитель DeepMind Макс Джадерберг (Max Jaderberg) возразил:

 

«[В нашей симуляции] один из агентов сидит в лагере противника, ожидая, когда вновь появится флаг, это возможно только потому, что он полагается на своего партнера по команде».

 

Джадерберг говорит об одной из тактик искусственного интеллекта, выработанной тем в ходе обучения, которая предполагает ожидание появления нового флага в лагере оппонента. Ее часто используют и люди.

 

В январе DeepMind сообщила, что ее искусственный интеллект AlphaStar одолел двух профессиональных игроков в стратегию StarCraft II, проходящую в реальном времени.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
24 ноября, 10:07
ПНИПУ

Бактериальные инфекции, вызываемые патогенами вроде стафилококка и микобактерий, провоцируют не только заболевания от ангины до туберкулеза, но и запускают разрушительную реакцию организма. Лейкоциты атакуют возбудителей, вызывая отек и температуру — защитные механизмы, которые часто усугубляют состояние, повреждая здоровые ткани и нарушая работу органов. Современная терапия бактериальных инфекций, сочетающая антибиотики и противовоспалительные средства, имеет побочные эффекты. Первые нарушают микрофлору кишечника, а вторые повреждают слизистую желудка. В результате лечение одной болезни провоцирует развитие новых осложнений. Для решения этой проблемы ученые Пермского Политеха разработали универсальное средство, которое одновременно убивает патогены и борется с воспалением. В сотрудничестве с коллегами из ИЭГМ УрО РАН и ПГФА было экспериментально подтверждено, что противовоспалительная активность пептидного комплекса на 13% выше аналога.

24 ноября, 08:30
Любовь С.

Чтобы охотиться при температурах ниже нуля, пауки рода Clubiona выработали особые белки-антифризы. Изучив членистоногих, собранных в грушевых садах неподалеку от города Брно (Чехия), ученые раскрыли молекулярный механизм, позволяющий этим паукам не впадать в зимнюю спячку.

23 ноября, 11:08
Максим Абдулаев

Бразильские зоологи выяснили, каких именно насекомых и пауков ловят домашние кошки в городах. Для этого использовали не полевые наблюдения, а анализ социальных сетей. Просмотрев более 17 000 видео и фото в TikTok и на фотостоке iStock, ученые нашли 550 записей кошачьей охоты. Самая частая добыча — кузнечики, сверчки, цикады и тараканы.

20 ноября, 13:12
Полина Меньшова

Человеческие языки разнообразны, но это разнообразие ограничивается повторяющимися закономерностями. Пытаясь описать правила, которым подчиняются различия в грамматике, лингвисты сформулировали ряд так называемых грамматических универсалий — утверждений, предположительно верных для всех или большинства языков мира. Международная команда ученых провела статистический анализ на материале 2430 языков и обнаружила, что соответствующими действительности можно считать около трети таких утверждений.

21 ноября, 10:02
ПНИПУ

Так называемые зумеры и альфа, несмотря на молодой возраст, уже формируют ключевые поведенческие и потребительские тренды. Ученые Пермского Политеха рассказали, почему обозначение поколений начали с конца алфавита, как альфа и зумеры отличаются в способности к терпеливости, совмещении цифрового и реального «Я», подходу к профессиональной деятельности и отношении к финансам, какое мышление пришло на смену клиповому и как использование искусственного интеллекта повлияет на авторитет родителей.

23 ноября, 11:08
Максим Абдулаев

Бразильские зоологи выяснили, каких именно насекомых и пауков ловят домашние кошки в городах. Для этого использовали не полевые наблюдения, а анализ социальных сетей. Просмотрев более 17 000 видео и фото в TikTok и на фотостоке iStock, ученые нашли 550 записей кошачьей охоты. Самая частая добыча — кузнечики, сверчки, цикады и тараканы.

25 октября, 10:40
Любовь С.

Проанализировав данные наблюдений, полученных с помощью наземных обсерваторий за последние два десятилетия, астрономы обнаружили потенциально обитаемый мир — суперземлю Gliese 251 c (GJ 251 с). Планета обращается вокруг красного карлика на расстоянии около 18 световых лет от Земли и считается одним из самых перспективных кандидатов для поисков жизни.

20 ноября, 13:12
Полина Меньшова

Человеческие языки разнообразны, но это разнообразие ограничивается повторяющимися закономерностями. Пытаясь описать правила, которым подчиняются различия в грамматике, лингвисты сформулировали ряд так называемых грамматических универсалий — утверждений, предположительно верных для всех или большинства языков мира. Международная команда ученых провела статистический анализ на материале 2430 языков и обнаружила, что соответствующими действительности можно считать около трети таких утверждений.

8 ноября, 18:29
Адель Романова

По расчетам, большинство «гостей» из других звездных систем летят к Земле примерно со стороны созвездия Геркулес. Скорее всего, они время от времени падают на нашу планету, просто мы еще не научились это замечать. Как удалось вычислить, чаще всего они должны падать зимой и где-то в окрестностях экватора.

[miniorange_social_login]

Комментарии

8 Комментариев
Ванечка
02.06.2019
-
0
+
Наибольшую угрозу представляет не ИИ и не правительства. Опаснее всего люди которые постят в коментах портянки на 3 экрана. Но ничего я верю что ИИ цензор справится и здесь :)
Edil Edil
02.06.2019
-
0
+
неужели AI-цензор здесь? или люди не спят в 4-00 в воскресенье?
Edil Edil
02.06.2019
-
1
+
facebook /pg/Выживание-415144336000566/posts/
Edil Edil
02.06.2019
-
1
+
Наибольшую угрозу представляет не правительство США, а именно Кремлевская группировка. Демократия – это не "понт", а работающие социальные механизмы ограничивающие произвол правителей. В Европе и США они не совершенны, но почти достаточны для прохождения "Великого фильтра". Российская же модель "Управляемой демократии" представляет собой угрозу большую, чем угроза от потепления, вулканов и всех естественных угроз вместе взятых. И, если угроза ядерной войны ≈20-25%, то угроза "Политической сингулярности" >50%, - Это использование Искусственного интеллекта для манипуляции сознанием "Вань". Да, "Политическая сингулярность" совсем не так страшна, как ядерная война, но только – первые 200 лет, пока правители будут зависимы от проблемного населения. Поэтому правильнее говорить не - Мы - Хозяин и я, и Они - европейцы, а - Мы - простые люди, и Они - правители. Допустим, Ване уже безразлична мучительная смерть его правнуков, тогда пусть он просто сравнит жизнь свою и германца, которого он хочет "повторить". И еще: Ракеты средней дальности опасны именно малым временем исправления ошибок автоматики. И нарушил этот Договор именно Кремль. И именно он выступает в роли шантажиста-террориста, взявшего в заложники 7 млрд. - И именно в РФ более вероятен сбой вооружения. Война нужна не-людям, - не само-определяющим свою жизнь (а это и есть "демократия"). То есть "демократия" – это не просто "ценности", а метод: a. Предотвращения войны, b. Предотвращения злоупотребления властью, которое погубит человечество. Про нарушение РСМД: "Минобороны России само предоставило в руки США доказательства нарушения РФ договора ДРСМД" https://rusmonitor.com/minoborony-rossii-samo-predostavilo-v-ruki-ssha-dokazatelstva-narusheniya-rf-dogovora-drsmd.html "Посол США в России передали координаты и даты испытаний ракеты 9М729" www.gazeta.ru/army/news/2019/02/04/12600553.shtml "Кремль не ожидал, что Трамп решится". Обвинения Кремлем США – вздор. "Нет другой возможности заставить Путина" www.svoboda.org/a/usa-today-inf-treaty/29566762.html Дело не в личности правителей, а в условиях, в которые они поставлены. - Институты демократии вынуждают чистоту помыслов западных правителей. - на Западе институты плохо ли, но как-то работают, а в РФ – вместо открытости, подконтрольности и т.д. работают другие механизмы - пропаганды. Дело не в конкретном правителе. Он, кстати, после следующих выборов, вероятно, останется на другом - усиленном посту, в "президенты" не вернется. Да, одной демократии и сменяемости власти недостаточно. Вы правы насчет Гитлера. Людьми можно манипулировать, настраивать их себе во вред, создавать лояльное большинство. Поэтому и продвигаю "Триаду спасения": 1. "Совещательная структура" – для профессионального потребления политики, противодействия, в частности, "промыванию мозгов" (продвигаю с 1990-го). 2. Онлайн-"игра" "Народовластие", с помощью спутникового Интернета, 3. Содружество микро-"государств" "Свободная (Южная) Россия" – для увеличения политической конкуренции. Экономика без демократии? Деньги дают власть, Правители проходят естественный отбор на алчность, цинизм и лицемерие. 1. Неконтролируемый коррупционер поднимает свою цену с помощью искусственных сложностей, и, этим тормозит экономику. Дешевая нефть как причина – это обман. 2. Если при разделе "пирога" нет механизма проведения интересов людей, то они проигрывают. Сравните неравенство доходов в Финляндии, Скандинавии и в РФ. Есть глубокие исследования о связи демократии и уровня жизни. На 1-го фанатика Ли Куан Ю, который сажал в тюрьму друзей приходится сотня "нормальных". Конечно, спорный вопрос - где счастливее люди – в КНР либо на Тайване. - Здесь речь не о воспитании общества "волков", а о выживании. "Выживальщикам" бы лучше подумать не об эффективности убийства голодных детей, а о недопущении таковых. Про сингулярность: https://habr.com/ru/post/293156/ Я тоже считаю, что на Западе многие сильно ошибаются насчет ИИ, Бостром, например, ИИ антропоморфизирует. Угрозу, связанную с ИИ, на Западе в определенном смысле - недооценивают. Угроза эта будет исходить не от самого ИИ, а от использования его владельцами, и, прежде всего – правителями – не находящимися под демократическим контролем.
Edil Edil
02.06.2019
-
1
+
Про сингулярность: https://habr.com/ru/post/293156/ Я тоже считаю, что на Западе многие сильно ошибаются насчет ИИ, Бостром, например, ИИ антропоморфизирует. Угрозу, связанную с ИИ, на Западе в определенном смысле - недооценивают. Угроза эта будет исходить не от самого ИИ, а от использования его владельцами, и, прежде всего – правителями – не находящимися под демократическим контролем. Наибольшую угрозу представляет не правительство США, а именно Кремлевская группировка. Демократия – это не "понт", а работающие социальные механизмы ограничивающие произвол правителей. В Европе и США они не совершенны, но почти достаточны для прохождения "Великого фильтра". Российская же модель "Управляемой демократии" представляет собой угрозу большую, чем угроза от потепления, вулканов и всех естественных угроз вместе взятых. И, если угроза ядерной войны ≈20-25%, то угроза "Политической сингулярности" >50%, - Это использование Искусственного интеллекта для манипуляции сознанием "Вань". Да, "Политическая сингулярность" совсем не так страшна, как ядерная война, но только – первые 200 лет, пока правители будут зависимы от проблемного населения. Поэтому правильнее говорить не - Мы - Хозяин и я, и Они - европейцы, а - Мы - простые люди, и Они - правители. Допустим, Ване уже безразлична мучительная смерть его правнуков, тогда пусть он просто сравнит жизнь свою и германца, которого он хочет "повторить". И еще: Ракеты средней дальности опасны именно малым временем исправления ошибок автоматики. И нарушил этот Договор именно Кремль. И именно он выступает в роли шантажиста-террориста, взявшего в заложники 7 млрд. - И именно в РФ более вероятен сбой вооружения. Война нужна не-людям, - не само-определяющим свою жизнь (а это и есть "демократия"). То есть "демократия" – это не просто "ценности", а метод: a. Предотвращения войны, b. Предотвращения злоупотребления властью, которое погубит человечество. Дело не в личности правителей, а в условиях, в которые они поставлены. - Институты демократии вынуждают чистоту помыслов западных правителей. - на Западе институты плохо ли, но как-то работают, а в РФ – вместо открытости, подконтрольности и т.д. работают другие механизмы - пропаганды. Дело не в конкретном правителе. Он, кстати, после следующих выборов, вероятно, останется на другом - усиленном посту, в "президенты" не вернется. Да, одной демократии и сменяемости власти недостаточно. Вы правы насчет Гитлера. Людьми можно манипулировать, настраивать их себе во вред, создавать лояльное большинство. Поэтому и продвигаю "Триаду спасения": 1. "Совещательная структура" – для профессионального потребления политики, противодействия, в частности, "промыванию мозгов" (продвигаю с 1990-го). 2. Онлайн-"игра" "Народовластие", с помощью спутникового Интернета, 3. Содружество микро-"государств" "Свободная (Южная) Россия" – для увеличения политической конкуренции. Экономика без демократии? Деньги дают власть, Правители проходят естественный отбор на алчность, цинизм и лицемерие. 1. Неконтролируемый коррупционер поднимает свою цену с помощью искусственных сложностей, и, этим тормозит экономику. Дешевая нефть как причина – это обман. 2. Если при разделе "пирога" нет механизма проведения интересов людей, то они проигрывают. Сравните неравенство доходов в Финляндии, Скандинавии и в РФ. Есть глубокие исследования о связи демократии и уровня жизни. На 1-го фанатика Ли Куан Ю, который сажал в тюрьму друзей приходится сотня "нормальных". Конечно, спорный вопрос - где счастливее люди – в КНР либо на Тайване. - Здесь речь не о воспитании общества "волков", а о выживании. "Выживальщикам" бы лучше подумать не об эффективности убийства голодных детей, а о недопущении таковых. Про нарушение РСМД: "Минобороны России само предоставило в руки США доказательства нарушения РФ договора ДРСМД" https://rusmonitor.com/minoborony-rossii-samo-predostavilo-v-ruki-ssha-dokazatelstva-narusheniya-rf-dogovora-drsmd.html "Посол США в России передали координаты и даты испытаний ракеты 9М729" www.gazeta.ru/army/news/2019/02/04/12600553.shtml "Кремль не ожидал, что Трамп решится". Обвинения Кремлем США – вздор. "Нет другой возможности заставить Путина" www.svoboda.org/a/usa-today-inf-treaty/29566762.html
-
0
+
Не вериться, но что бы накачаться и похудеть не нужно ходить в качалку или жрать химию. Опробовал лично и результат удивил: за две недели убрал пузо и скинул пару кило, а жена накачала попу и убрала в талии пару сантиметров и это все без спорта, диет и химии!Реально крутая штука, а вычитал о ней здесь ---- http://most.tk/nnblog
Дота - последняя надежда человечества.
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно