31.05.2019, 10:33

alex007

16,6 тыс

Искусственный интеллект DeepMind победил людей в кооперативной игре Quake III Arena

Агенты нейросети тренировались на тысячах игр одновременно, проведя около 450 тысяч матчей.

Технологии

# DeepMind

# искусственный интеллект

# машинное обучение

# обучение с подкреплением

©Wikipedia / Автор: Sycophanta Duccius

Сотрудники британской компании DeepMind, которая с 2014 года принадлежит Google, опубликовали статью в журнале Science, посвященную успехам их искусственного интеллекта. На этот раз они смогли натренировать алгоритм на командную игру в режиме «Захват флага» мультиплеерного шутера Quake III Arena. Команда из агентов ИИ в подавляющем количестве игр победила команду людей.

Для тренировки агентов специалисты использовали обучение с подкреплением — метод машинного обучения, при котором система учится, взаимодействуя со средой. Авторы статьи пишут, что этот метод успешно зарекомендовал себя в обучении одного агента, но они хотели узнать, насколько он успешен при командной работе.

В качестве платформы они выбрали мультиплеерный шутер от первого лица Quake III Arena, но задали свои условия игры. Во-первых, карты каждый раз генерируются случайно. Во-вторых, в матче принимают участие только четыре игрока: по два с каждой стороны. Соревнование проходит только в одном режиме — «Захват флага»: каждая из команд должна одновременно защитить свой флаг, захватить флаг оппонентов и принести на свою базу. Реакцию системы снизили до средних показателей человека.

Авторы тренировали 30 агентов. Тренировка происходила благодаря многотысячным параллельным партиям, которые отыгрывали агенты. При этом каждый агент представлял собой индивидуальную единицу, которая действует самостоятельно, исходя из обучения с подкреплением. Специалисты также демонстрируют филогенетическое дерево, которое строится в ходе этого обучения.

Процесс обучения / ©Science

После тренировок алгоритмы сыграли несколько партий с командой людей. Обе команды играли на неизвестных для них картах. Пара агентов за игру в среднем захватывала на 16 флагов больше, чем пара людей. Только когда человек играл в партнерстве с искусственным интеллектом, ему удавалось выиграть у объединения алгоритмов (5% вероятности победы).

Профессор Технологического колледжа Джорджии Марк Ридл (Mark Riedl) раскритиковал такой подход британской фирмы, сказав, что агенты не обмениваются сообщениями, а лишь реагируют на те события, которые происходят в игре. Однако представитель DeepMind Макс Джадерберг (Max Jaderberg) возразил:

«[В нашей симуляции] один из агентов сидит в лагере противника, ожидая, когда вновь появится флаг, это возможно только потому, что он полагается на своего партнера по команде».

Джадерберг говорит об одной из тактик искусственного интеллекта, выработанной тем в ходе обучения, которая предполагает ожидание появления нового флага в лагере оппонента. Ее часто используют и люди.

В январе DeepMind сообщила, что ее искусственный интеллект AlphaStar одолел двух профессиональных игроков в стратегию StarCraft II, проходящую в реальном времени.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Технологии

# DeepMind

# искусственный интеллект

# машинное обучение

# обучение с подкреплением

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Эволюция социальности позвоночных в контексте происхождения человеческого общества

Библиотека им. Н. А. Некрасова

Москва

Лекция

14 Июл

Бесплатно

Устойчивость транспортной системы, или нужны ли нам электросамокаты?

Библиотека Планетарий 1

Санкт-Петербург

Лекция

15 Июл

2000 ₽

Будущее русского языка

Medio Modo

Москва

Лекция

15 Июл

Бесплатно

Почему «Война и мир» – великая книга?

ВДНХ

Москва

Лекция

15 Июл

Бесплатно

Философия искусственного интеллекта: новые вопросы о человеке и мире

Библиотека им. Анны Ахматовой

Москва

Лекция

16 Июл

Бесплатно

Миклухо-Маклай и секретное плавание корвета «Скобелев»

Русское географическое общество

Санкт-Петербург

Лекция

16 Июл

Бесплатно

Вирусы против опухоли: новые подходы в терапии рака

Парк «Зарядье»

Москва

Лекция

16 Июл

Бесплатно

Сердце как инженерная задача: от насоса к тканевой инженерии

Центр «Архэ»

Москва

Экскурсия

17 Июл

Бесплатно

Программа «Союз-Аполлон»: полет, подаривший надежду человечеству

Космонавтика и авиация

Москва

Популярное

За сутки

За неделю

За месяц

12 июля, 12:24

Марк Чернов

Интервальное голодание оказалось не хуже подсчета калорий — и оно значительно легче переносится

Ученые выяснили, почему интервальное голодание для многих оказывается эффективнее обычных диет. Исследование показало, что ограничение времени для приема пищи избавляет худеющего от изнуряющего ощущения жесткого контроля и при этом позволяет сбросить ровно столько же, сколько при скрупулезном подсчете калорий.

Медицина

# диета

# интервальное голодание

# лишний вес

# метаболизм

# питание

# похудение

13 июля, 14:06

Максим Абдулаев

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Кит живет двести лет, умеет пробивать головой полуметровый лед и поет океанский джаз голосом несмазанной дверной петли. Охотоморские гренландские киты — это не просто многотонные ледоколы. Это древние узники, которые остались жить в Охотском море со времен последнего оледенения. Это счастливцы, которые смогли пережить гарпуны китобоев XIX-XX веков, но сегодня уязвимы не меньше. Чтобы спасти этих поразительных китов, российским ученым и команде фонда «Природа и люди» приходится: считать хвосты, читать биографии по шрамам, прятать подростков от хищников, стрелять (спутниковыми метками) с парамоторов и тяжелых дронов. Рассказываем, как устроена жизнь гренландских китов России и кто помогает им не исчезнуть навсегда с лица планеты.

Биология

# Баренцево море

# горбатые киты

# защита природы

# китообразные

# киты

# косатки

# природа

# усатые киты

Выбор редакции

13 июля, 11:22

Илья Гриднев

Генетики заставили растение синтезировать пять психоделиков одновременно

Израильские биологи научили родственника табака самостоятельно вырабатывать пять психоделических веществ, которые в природе происходят из трех царств: растений, грибов и животных. Для этого ученые впервые расшифровали природный путь выработки ДМТ, а затем перенесли нужные гены в один организм.

Биология

# биотехнологии

# ботаника

# генное редактирования

# психоделик

12 июля, 12:24

Марк Чернов

Интервальное голодание оказалось не хуже подсчета калорий — и оно значительно легче переносится

Медицина

# диета

# интервальное голодание

# лишний вес

# метаболизм

# питание

# похудение

13 июля, 14:06

Максим Абдулаев

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Биология

# Баренцево море

# горбатые киты

# защита природы

# китообразные

# киты

# косатки

# природа

# усатые киты

Выбор редакции

13 июля, 11:22

Илья Гриднев

Генетики заставили растение синтезировать пять психоделиков одновременно

Биология

# биотехнологии

# ботаника

# генное редактирования

# психоделик

25 июня, 16:20

Любовь С.

Физики уточнили возможные размеры Вселенной

Вселенная может оказаться «замкнутой» глобальной структурой, где свет от далеких галактик способен возвращаться к наблюдателю с разных направлений. Именно такой сценарий не удалось исключить авторам нового масштабного обзора. Проверить его предсказания астрономы смогут уже в ближайшие годы.

Астрономия

# бесконечность

# вселенная

# геометрия

# пространство

# реликтовое излучение

# свет

# топология

25 июня, 15:09

Марк Чернов

Физики подтвердили гипотезу о существовании двух жидких состояний воды

Ученые впервые на молекулярном уровне доказали, что обычная вода одновременно состоит из двух разных жидких состояний — более плотного и менее плотного, которые непрерывно сменяют друг друга. Раз молекулярная «двойственность» действительно существует, это подтверждает спорную 30-летнюю гипотезу. Новое открытие поможет, наконец, объяснить десятки «странных» физических аномалий воды, включая ее расширение при замерзании и парадоксальное изменение вязкости под давлением.

Физика

# вода

# Молекулярная биология

# структура воды

# фазовые переходы

26 июня, 14:54

Максим Абдулаев

Начало деменции у пожилых собак определили по их походке

Американские ветеринары установили, что длина шага передних лап у пожилых собак отражает возрастные изменения в работе мозга. Когда у собак развивается деменция, шаги их передних лап становятся короче, причем эта связь не зависит от хронической боли в суставах.

Биология

# деменция

# походка

# собаки

# старение

[miniorange_social_login]

Наибольшую угрозу представляет не ИИ и не правительства. Опаснее всего люди которые постят в коментах портянки на 3 экрана. Но ничего я верю что ИИ цензор справится и здесь :)

Ответить

Edil Edil

02.06.2019

неужели AI-цензор здесь? или люди не спят в 4-00 в воскресенье?

Ответить

Edil Edil

02.06.2019

facebook /pg/Выживание-415144336000566/posts/

Ответить

Edil Edil

02.06.2019

Наибольшую угрозу представляет не правительство США, а именно Кремлевская группировка. Демократия – это не "понт", а работающие социальные механизмы ограничивающие произвол правителей. В Европе и США они не совершенны, но почти достаточны для прохождения "Великого фильтра". Российская же модель "Управляемой демократии" представляет собой угрозу большую, чем угроза от потепления, вулканов и всех естественных угроз вместе взятых. И, если угроза ядерной войны ≈20-25%, то угроза "Политической сингулярности" >50%, - Это использование Искусственного интеллекта для манипуляции сознанием "Вань". Да, "Политическая сингулярность" совсем не так страшна, как ядерная война, но только – первые 200 лет, пока правители будут зависимы от проблемного населения. Поэтому правильнее говорить не - Мы - Хозяин и я, и Они - европейцы, а - Мы - простые люди, и Они - правители. Допустим, Ване уже безразлична мучительная смерть его правнуков, тогда пусть он просто сравнит жизнь свою и германца, которого он хочет "повторить". И еще: Ракеты средней дальности опасны именно малым временем исправления ошибок автоматики. И нарушил этот Договор именно Кремль. И именно он выступает в роли шантажиста-террориста, взявшего в заложники 7 млрд. - И именно в РФ более вероятен сбой вооружения. Война нужна не-людям, - не само-определяющим свою жизнь (а это и есть "демократия"). То есть "демократия" – это не просто "ценности", а метод: a. Предотвращения войны, b. Предотвращения злоупотребления властью, которое погубит человечество. Про нарушение РСМД: "Минобороны России само предоставило в руки США доказательства нарушения РФ договора ДРСМД" https://rusmonitor.com/minoborony-rossii-samo-predostavilo-v-ruki-ssha-dokazatelstva-narusheniya-rf-dogovora-drsmd.html "Посол США в России передали координаты и даты испытаний ракеты 9М729" www.gazeta.ru/army/news/2019/02/04/12600553.shtml "Кремль не ожидал, что Трамп решится". Обвинения Кремлем США – вздор. "Нет другой возможности заставить Путина" www.svoboda.org/a/usa-today-inf-treaty/29566762.html Дело не в личности правителей, а в условиях, в которые они поставлены. - Институты демократии вынуждают чистоту помыслов западных правителей. - на Западе институты плохо ли, но как-то работают, а в РФ – вместо открытости, подконтрольности и т.д. работают другие механизмы - пропаганды. Дело не в конкретном правителе. Он, кстати, после следующих выборов, вероятно, останется на другом - усиленном посту, в "президенты" не вернется. Да, одной демократии и сменяемости власти недостаточно. Вы правы насчет Гитлера. Людьми можно манипулировать, настраивать их себе во вред, создавать лояльное большинство. Поэтому и продвигаю "Триаду спасения": 1. "Совещательная структура" – для профессионального потребления политики, противодействия, в частности, "промыванию мозгов" (продвигаю с 1990-го). 2. Онлайн-"игра" "Народовластие", с помощью спутникового Интернета, 3. Содружество микро-"государств" "Свободная (Южная) Россия" – для увеличения политической конкуренции. Экономика без демократии? Деньги дают власть, Правители проходят естественный отбор на алчность, цинизм и лицемерие. 1. Неконтролируемый коррупционер поднимает свою цену с помощью искусственных сложностей, и, этим тормозит экономику. Дешевая нефть как причина – это обман. 2. Если при разделе "пирога" нет механизма проведения интересов людей, то они проигрывают. Сравните неравенство доходов в Финляндии, Скандинавии и в РФ. Есть глубокие исследования о связи демократии и уровня жизни. На 1-го фанатика Ли Куан Ю, который сажал в тюрьму друзей приходится сотня "нормальных". Конечно, спорный вопрос - где счастливее люди – в КНР либо на Тайване. - Здесь речь не о воспитании общества "волков", а о выживании. "Выживальщикам" бы лучше подумать не об эффективности убийства голодных детей, а о недопущении таковых. Про сингулярность: https://habr.com/ru/post/293156/ Я тоже считаю, что на Западе многие сильно ошибаются насчет ИИ, Бостром, например, ИИ антропоморфизирует. Угрозу, связанную с ИИ, на Западе в определенном смысле - недооценивают. Угроза эта будет исходить не от самого ИИ, а от использования его владельцами, и, прежде всего – правителями – не находящимися под демократическим контролем.

Ответить

Edil Edil

02.06.2019

Про сингулярность: https://habr.com/ru/post/293156/ Я тоже считаю, что на Западе многие сильно ошибаются насчет ИИ, Бостром, например, ИИ антропоморфизирует. Угрозу, связанную с ИИ, на Западе в определенном смысле - недооценивают. Угроза эта будет исходить не от самого ИИ, а от использования его владельцами, и, прежде всего – правителями – не находящимися под демократическим контролем. Наибольшую угрозу представляет не правительство США, а именно Кремлевская группировка. Демократия – это не "понт", а работающие социальные механизмы ограничивающие произвол правителей. В Европе и США они не совершенны, но почти достаточны для прохождения "Великого фильтра". Российская же модель "Управляемой демократии" представляет собой угрозу большую, чем угроза от потепления, вулканов и всех естественных угроз вместе взятых. И, если угроза ядерной войны ≈20-25%, то угроза "Политической сингулярности" >50%, - Это использование Искусственного интеллекта для манипуляции сознанием "Вань". Да, "Политическая сингулярность" совсем не так страшна, как ядерная война, но только – первые 200 лет, пока правители будут зависимы от проблемного населения. Поэтому правильнее говорить не - Мы - Хозяин и я, и Они - европейцы, а - Мы - простые люди, и Они - правители. Допустим, Ване уже безразлична мучительная смерть его правнуков, тогда пусть он просто сравнит жизнь свою и германца, которого он хочет "повторить". И еще: Ракеты средней дальности опасны именно малым временем исправления ошибок автоматики. И нарушил этот Договор именно Кремль. И именно он выступает в роли шантажиста-террориста, взявшего в заложники 7 млрд. - И именно в РФ более вероятен сбой вооружения. Война нужна не-людям, - не само-определяющим свою жизнь (а это и есть "демократия"). То есть "демократия" – это не просто "ценности", а метод: a. Предотвращения войны, b. Предотвращения злоупотребления властью, которое погубит человечество. Дело не в личности правителей, а в условиях, в которые они поставлены. - Институты демократии вынуждают чистоту помыслов западных правителей. - на Западе институты плохо ли, но как-то работают, а в РФ – вместо открытости, подконтрольности и т.д. работают другие механизмы - пропаганды. Дело не в конкретном правителе. Он, кстати, после следующих выборов, вероятно, останется на другом - усиленном посту, в "президенты" не вернется. Да, одной демократии и сменяемости власти недостаточно. Вы правы насчет Гитлера. Людьми можно манипулировать, настраивать их себе во вред, создавать лояльное большинство. Поэтому и продвигаю "Триаду спасения": 1. "Совещательная структура" – для профессионального потребления политики, противодействия, в частности, "промыванию мозгов" (продвигаю с 1990-го). 2. Онлайн-"игра" "Народовластие", с помощью спутникового Интернета, 3. Содружество микро-"государств" "Свободная (Южная) Россия" – для увеличения политической конкуренции. Экономика без демократии? Деньги дают власть, Правители проходят естественный отбор на алчность, цинизм и лицемерие. 1. Неконтролируемый коррупционер поднимает свою цену с помощью искусственных сложностей, и, этим тормозит экономику. Дешевая нефть как причина – это обман. 2. Если при разделе "пирога" нет механизма проведения интересов людей, то они проигрывают. Сравните неравенство доходов в Финляндии, Скандинавии и в РФ. Есть глубокие исследования о связи демократии и уровня жизни. На 1-го фанатика Ли Куан Ю, который сажал в тюрьму друзей приходится сотня "нормальных". Конечно, спорный вопрос - где счастливее люди – в КНР либо на Тайване. - Здесь речь не о воспитании общества "волков", а о выживании. "Выживальщикам" бы лучше подумать не об эффективности убийства голодных детей, а о недопущении таковых. Про нарушение РСМД: "Минобороны России само предоставило в руки США доказательства нарушения РФ договора ДРСМД" https://rusmonitor.com/minoborony-rossii-samo-predostavilo-v-ruki-ssha-dokazatelstva-narusheniya-rf-dogovora-drsmd.html "Посол США в России передали координаты и даты испытаний ракеты 9М729" www.gazeta.ru/army/news/2019/02/04/12600553.shtml "Кремль не ожидал, что Трамп решится". Обвинения Кремлем США – вздор. "Нет другой возможности заставить Путина" www.svoboda.org/a/usa-today-inf-treaty/29566762.html

Ответить

Миша Маслов

01.06.2019

Не вериться, но что бы накачаться и похудеть не нужно ходить в качалку или жрать химию. Опробовал лично и результат удивил: за две недели убрал пузо и скинул пару кило, а жена накачала попу и убрала в талии пару сантиметров и это все без спорта, диет и химии!Реально крутая штука, а вычитал о ней здесь ---- http://most.tk/nnblog

Ответить

ulogin_facebook_1675895662457286

31.05.2019

Дота - последняя надежда человечества.

Ответить

—

Edil Edil

02.06.2019

неужели AI-цензор здесь? или люди не спят в 4-00 в воскресенье?

Ответить

Edil Edil

02.06.2019

Ответить

Edil Edil

02.06.2019

Ответить

Edil Edil

02.06.2019

facebook /pg/Выживание-415144336000566/posts/

Ответить

ulogin_facebook_1675895662457286

31.05.2019

Дота - последняя надежда человечества.

Ответить

—

Edil Edil

02.06.2019

неужели AI-цензор здесь? или люди не спят в 4-00 в воскресенье?

Ответить

Миша Маслов

01.06.2019

Ответить

Edil Edil

02.06.2019

неужели AI-цензор здесь? или люди не спят в 4-00 в воскресенье?

Ответить

Ванечка

02.06.2019

Ответить

Искусственный интеллект DeepMind победил людей в кооперативной игре Quake III Arena

По теме

Гипертонию «вычислили» по голосу пациента

Знаете ли вы…

Искусственный интеллект позволит диагностировать болезни растений по фотографиям

Популярное

Комментарии

Последние новости:

Физик создал маленькую Вселенную, для которой нет понятия времени

Карта будущих катастроф: ученые нашли «горячие точки» мегаземлетрясений в России

Ученые выяснили, почему детей в христианской Скандинавии хоронили вместе с чужими взрослыми

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Климатический «щелчок»: может ли Эль-Ниньо изменить привычный нам мир

Промышленный кошмар: почему терраформирование Марса может оказаться неподъемной задачей

Невозможное возможно: как вакуумный двигатель SpaceX RaptorVAC работает при атмосферном давлении

Последние комментарии

Самые обсуждаемые

YouTube в России вырос даже с ограничениями, в отличие от «VK Видео»

Климатический «щелчок»: может ли Эль-Ниньо изменить привычный нам мир

Психологи выяснили, почему молодежь не спешит в ЗАГС

Межзвездная комета 3I/ATLAS оказалась вдвое старше Солнца