31.05.2019, 10:33

alex007

16,6 тыс

Искусственный интеллект DeepMind победил людей в кооперативной игре Quake III Arena

Агенты нейросети тренировались на тысячах игр одновременно, проведя около 450 тысяч матчей.

Технологии

# DeepMind

# искусственный интеллект

# машинное обучение

# обучение с подкреплением

©Wikipedia / Автор: Sycophanta Duccius

Сотрудники британской компании DeepMind, которая с 2014 года принадлежит Google, опубликовали статью в журнале Science, посвященную успехам их искусственного интеллекта. На этот раз они смогли натренировать алгоритм на командную игру в режиме «Захват флага» мультиплеерного шутера Quake III Arena. Команда из агентов ИИ в подавляющем количестве игр победила команду людей.

Для тренировки агентов специалисты использовали обучение с подкреплением — метод машинного обучения, при котором система учится, взаимодействуя со средой. Авторы статьи пишут, что этот метод успешно зарекомендовал себя в обучении одного агента, но они хотели узнать, насколько он успешен при командной работе.

В качестве платформы они выбрали мультиплеерный шутер от первого лица Quake III Arena, но задали свои условия игры. Во-первых, карты каждый раз генерируются случайно. Во-вторых, в матче принимают участие только четыре игрока: по два с каждой стороны. Соревнование проходит только в одном режиме — «Захват флага»: каждая из команд должна одновременно защитить свой флаг, захватить флаг оппонентов и принести на свою базу. Реакцию системы снизили до средних показателей человека.

Авторы тренировали 30 агентов. Тренировка происходила благодаря многотысячным параллельным партиям, которые отыгрывали агенты. При этом каждый агент представлял собой индивидуальную единицу, которая действует самостоятельно, исходя из обучения с подкреплением. Специалисты также демонстрируют филогенетическое дерево, которое строится в ходе этого обучения.

Процесс обучения / ©Science

После тренировок алгоритмы сыграли несколько партий с командой людей. Обе команды играли на неизвестных для них картах. Пара агентов за игру в среднем захватывала на 16 флагов больше, чем пара людей. Только когда человек играл в партнерстве с искусственным интеллектом, ему удавалось выиграть у объединения алгоритмов (5% вероятности победы).

Профессор Технологического колледжа Джорджии Марк Ридл (Mark Riedl) раскритиковал такой подход британской фирмы, сказав, что агенты не обмениваются сообщениями, а лишь реагируют на те события, которые происходят в игре. Однако представитель DeepMind Макс Джадерберг (Max Jaderberg) возразил:

«[В нашей симуляции] один из агентов сидит в лагере противника, ожидая, когда вновь появится флаг, это возможно только потому, что он полагается на своего партнера по команде».

Джадерберг говорит об одной из тактик искусственного интеллекта, выработанной тем в ходе обучения, которая предполагает ожидание появления нового флага в лагере оппонента. Ее часто используют и люди.

В январе DeepMind сообщила, что ее искусственный интеллект AlphaStar одолел двух профессиональных игроков в стратегию StarCraft II, проходящую в реальном времени.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Технологии

# DeepMind

# искусственный интеллект

# машинное обучение

# обучение с подкреплением

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Кто такие дрожжи и почему вокруг них столько мифов?

Библиотека Планетарий 1

Санкт-Петербург

Космонавтика и авиация

Москва

Космонавтика и авиация

Москва

Лекция

01 Авг

Бесплатно

Как устроены здания для жизни

Политехнический музей

Москва

Лекция

01 Авг

Бесплатно

Эмодзи или крокозябры: китайские иероглифы в поисках смысла и звука

ВДНХ

Москва

Лекция

02 Авг

Бесплатно

Неземные звуки: как звучит космос в научно-фантастических фильмах

Космонавтика и авиация

Москва

Лекция

02 Авг

Бесплатно

Лето с Гомером — карманный путеводитель по миру «Одиссеи» и «Илиады»

ВДНХ

Москва

Лекция

02 Авг

Бесплатно

Анатомия запаха: сенсорная инженерия парфюмеров

Библиотека Планетарий 1

Санкт-Петербург

Лекция

03 Авг

Бесплатно

Тайны земноводных: лягушка-голиаф, ядовитый древолаз и загадочный аксолотль

Российская государственная библиотека для молодежи

Москва

Популярное

За сутки

За неделю

За месяц

30 июля, 06:28

Мария Азарова

Масштабное исследование показало, что влияет на сексуальную удовлетворенность женщин сильнее всего

Сексуальная удовлетворенность женщин оказалась намного сильнее связана не с тем, насколько легко достигается оргазм, а с тем, чтобы это происходило именно с партнером. К такому выводу пришли исследователи, проанализировавшие данные почти 28 тысяч пользовательниц приложения Flo.

Психология

# женщина

# Женщины

# мастурбация

# секс

# сексуальная жизнь

# сексуальное поведение

# сексуальное удовольствие

# удовольствие

29 июля, 11:04

Сколтех

Физики из России решили 60-летнюю проблему создания перовскитного лазерного диода

Ученые из Сколтеха (группа ВЭБ.РФ) и их коллеги из Университета ИТМО и НИУ ВШЭ впервые продемонстрировали прямую электрическую накачку поляритонного лазера на основе галогенидного перовскитного микрокристалла, полученного из раствора. Результаты исследования представляют собой решение давней проблемы физики полупроводников и оптоэлектроники, которая десятилетиями оставалась препятствием на пути к решению технологической задачи: создать недорогие неэпитаксиальные лазерные диоды, работающие под непрерывным электрическим током. Такие устройства найдут применение в оптических сенсорах и спектроскопии, высокоскоростных вычислениях и энергоэффективных нейроморфных компьютерах.

Сколтех

# лазер

# Перовскит

# физика

# электроника

30 июля, 16:08

ФизТех

Что считать частицей: физики предложили новое объяснение парадокса Клейна

Коллектив физиков-теоретиков из МФТИ обратился к одному из самых старых и упрямых сюжетов квантовой физики — парадоксу Клейна. Им удалось показать, что электрический ток, который сильное поле «выманивает» из пустоты, определяется тем, что именно называть частицами.

ФизТех

# вакуум

# квантовая физика

# парадоксы

# теоретическая физика

# частицы

28 июля, 13:27

Александр Березин

Эксперт назвал ключевую технологию Starship тупиковой

Бывшие сотрудники NASA констатировали, что последнее видео испытаний крупнейшего космического корабля в истории снова показало проблемы и ограничения его теплового щита. С их точки зрения, любая из существующих технологий такого типа слишком сложна для реализации замысла Илона Маска о быстрой и безремонтной многоразовости Starship.

Космонавтика

# SpaceX

# StarShip

# космонавтика

28 июля, 13:10

Марк Чернов

Кофе защитил печень от ожирения, цирроза и рака: крупное исследование раскрыло механизмы его пользы

Американские ученые установили, что привычка регулярно пить кофе значительно снижает риск развития цирроза, рака печени и печеночных патологий. Новые данные помогают объяснить биохимические механизмы, стоящие за защитным эффектом этого напитка.

Медицина

# воспаление

# здоровье

# кофе

# печень

# питание

# рак печени

# цирроз

24 июля, 11:13

Игорь Байдов

Звуки помогли повысить урожайность

Правильно подобранные звуковые последовательности способны не только стимулировать рост растений, но и влиять на их урожайность. К такому выводу пришли авторы нового исследования. Они разработали технологию, которая позволяет воздействовать на процессы развития растений через акустические сигналы без использования генной инженерии или химикатов. В экспериментах добились повышения урожайности мяты, сои, болгарского перца и конопли.

Биология

# ботаника

# звуки

# каннабис

# конопля

# растения

# урожайность

9 июля, 13:06

Редакция Naked Science

YouTube в России вырос даже с ограничениями, в отличие от «VK Видео»

Видеосервисы стали неотъемлемой частью жизни россиян. В 2026 году охваты большинства платформ продолжают расти, в том числе YouTube.

Медиа

# «ВКонтакте»

# YouTube

# аудитория

# блокировки

# видеосервис

# интернет

# медиа

19 июля, 20:09

Александр Березин

Кризис без дефицита: почему Россия встала в очереди за бензином и когда они закончатся

Очереди на заправках стали привычным явлением в России, а на фоне информационного вакуума от властей о конкретных показателях производства бензина в июне население вынуждено ориентироваться на слухи. Все это выглядит довольно странно, но есть нюанс: скорее всего, кризис уже начинает выдыхаться. Как именно мы это выяснили?

С точки зрения науки

# бензин

# нпз

# Россия

# экономика

Выбор редакции

1 июля, 11:54

Марк Чернов

Историки объяснили, как римляне строили идеально прямые дороги на тысячи километров

Древнеримские инженеры проложили колоссальную сеть дорог через Европу, Северную Африку и Ближний Восток, многие участки которой до сих пор поражают безупречной прямолинейностью. Секрет строительства заключался в использовании трех особых геодезических инструментов, с помощью которых разбивали местность на ровные отрезки и размечали трассы.

История

# Древний Рим

# инженерия

# инструменты

# история

# Римская империя

[miniorange_social_login]

Наибольшую угрозу представляет не ИИ и не правительства. Опаснее всего люди которые постят в коментах портянки на 3 экрана. Но ничего я верю что ИИ цензор справится и здесь :)

Ответить

Edil Edil

02.06.2019

неужели AI-цензор здесь? или люди не спят в 4-00 в воскресенье?

Ответить

Edil Edil

02.06.2019

facebook /pg/Выживание-415144336000566/posts/

Ответить

Edil Edil

02.06.2019

Про сингулярность: https://habr.com/ru/post/293156/ Я тоже считаю, что на Западе многие сильно ошибаются насчет ИИ, Бостром, например, ИИ антропоморфизирует. Угрозу, связанную с ИИ, на Западе в определенном смысле - недооценивают. Угроза эта будет исходить не от самого ИИ, а от использования его владельцами, и, прежде всего – правителями – не находящимися под демократическим контролем. Наибольшую угрозу представляет не правительство США, а именно Кремлевская группировка. Демократия – это не "понт", а работающие социальные механизмы ограничивающие произвол правителей. В Европе и США они не совершенны, но почти достаточны для прохождения "Великого фильтра". Российская же модель "Управляемой демократии" представляет собой угрозу большую, чем угроза от потепления, вулканов и всех естественных угроз вместе взятых. И, если угроза ядерной войны ≈20-25%, то угроза "Политической сингулярности" >50%, - Это использование Искусственного интеллекта для манипуляции сознанием "Вань". Да, "Политическая сингулярность" совсем не так страшна, как ядерная война, но только – первые 200 лет, пока правители будут зависимы от проблемного населения. Поэтому правильнее говорить не - Мы - Хозяин и я, и Они - европейцы, а - Мы - простые люди, и Они - правители. Допустим, Ване уже безразлична мучительная смерть его правнуков, тогда пусть он просто сравнит жизнь свою и германца, которого он хочет "повторить". И еще: Ракеты средней дальности опасны именно малым временем исправления ошибок автоматики. И нарушил этот Договор именно Кремль. И именно он выступает в роли шантажиста-террориста, взявшего в заложники 7 млрд. - И именно в РФ более вероятен сбой вооружения. Война нужна не-людям, - не само-определяющим свою жизнь (а это и есть "демократия"). То есть "демократия" – это не просто "ценности", а метод: a. Предотвращения войны, b. Предотвращения злоупотребления властью, которое погубит человечество. Дело не в личности правителей, а в условиях, в которые они поставлены. - Институты демократии вынуждают чистоту помыслов западных правителей. - на Западе институты плохо ли, но как-то работают, а в РФ – вместо открытости, подконтрольности и т.д. работают другие механизмы - пропаганды. Дело не в конкретном правителе. Он, кстати, после следующих выборов, вероятно, останется на другом - усиленном посту, в "президенты" не вернется. Да, одной демократии и сменяемости власти недостаточно. Вы правы насчет Гитлера. Людьми можно манипулировать, настраивать их себе во вред, создавать лояльное большинство. Поэтому и продвигаю "Триаду спасения": 1. "Совещательная структура" – для профессионального потребления политики, противодействия, в частности, "промыванию мозгов" (продвигаю с 1990-го). 2. Онлайн-"игра" "Народовластие", с помощью спутникового Интернета, 3. Содружество микро-"государств" "Свободная (Южная) Россия" – для увеличения политической конкуренции. Экономика без демократии? Деньги дают власть, Правители проходят естественный отбор на алчность, цинизм и лицемерие. 1. Неконтролируемый коррупционер поднимает свою цену с помощью искусственных сложностей, и, этим тормозит экономику. Дешевая нефть как причина – это обман. 2. Если при разделе "пирога" нет механизма проведения интересов людей, то они проигрывают. Сравните неравенство доходов в Финляндии, Скандинавии и в РФ. Есть глубокие исследования о связи демократии и уровня жизни. На 1-го фанатика Ли Куан Ю, который сажал в тюрьму друзей приходится сотня "нормальных". Конечно, спорный вопрос - где счастливее люди – в КНР либо на Тайване. - Здесь речь не о воспитании общества "волков", а о выживании. "Выживальщикам" бы лучше подумать не об эффективности убийства голодных детей, а о недопущении таковых. Про нарушение РСМД: "Минобороны России само предоставило в руки США доказательства нарушения РФ договора ДРСМД" https://rusmonitor.com/minoborony-rossii-samo-predostavilo-v-ruki-ssha-dokazatelstva-narusheniya-rf-dogovora-drsmd.html "Посол США в России передали координаты и даты испытаний ракеты 9М729" www.gazeta.ru/army/news/2019/02/04/12600553.shtml "Кремль не ожидал, что Трамп решится". Обвинения Кремлем США – вздор. "Нет другой возможности заставить Путина" www.svoboda.org/a/usa-today-inf-treaty/29566762.html

Ответить

ulogin_facebook_1675895662457286

31.05.2019

Дота - последняя надежда человечества.

Ответить

—

Edil Edil

02.06.2019

неужели AI-цензор здесь? или люди не спят в 4-00 в воскресенье?

Ответить

Edil Edil

02.06.2019

facebook /pg/Выживание-415144336000566/posts/

Ответить

Edil Edil

02.06.2019

Ответить

Ванечка

02.06.2019

Ответить

Edil Edil

02.06.2019

неужели AI-цензор здесь? или люди не спят в 4-00 в воскресенье?

Ответить

ulogin_facebook_1675895662457286

31.05.2019

Дота - последняя надежда человечества.

Ответить

—

Edil Edil

02.06.2019

неужели AI-цензор здесь? или люди не спят в 4-00 в воскресенье?

Ответить

Искусственный интеллект DeepMind победил людей в кооперативной игре Quake III Arena

По теме

Ученые выяснили, как внедрить машинное обучение для мониторинга морского мусора

Гипертонию «вычислили» по голосу пациента

Знаете ли вы…

Популярное

Комментарии

Последние новости:

Что считать частицей: физики предложили новое объяснение парадокса Клейна

В атмосфере Венеры нашли следы гигантских атмосферных волн

Ученые впервые проследили рекордное путешествие ягуара длиной свыше 2000 километров

Археогенетики обнаружили древнейшие следы распространения чумы через всю Евразию

Кризис без дефицита: почему Россия встала в очереди за бензином и когда они закончатся

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Климатический «щелчок»: может ли Эль-Ниньо изменить привычный нам мир

Промышленный кошмар: почему терраформирование Марса может оказаться неподъемной задачей

Последние комментарии

Самые обсуждаемые

Starship впервые в истории вывел в космос полезную нагрузку — чтобы сразу сжечь ее в атмосфере

Эксперт назвал ключевую технологию Starship тупиковой

Геологи нашли следы самой длинной эры пожаров в истории Земли

Внеземные цивилизации предложили искать по замедленному вращению звезд