Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Нейросеть освоила видеоигру по языковому гайду
Студенты Стэнфордского университета разработали компьютерный алгоритм, который обучили проходить видеоигру посредством простых команд на английском языке.
В большинстве случаев при обучении искусственных нейросетей прохождению видеоигр используются алгоритмы с подкреплением — этот метод предполагает получение компьютером внешней обратной связи о своих действиях, например в виде зарабатывания очков. В процессе тренировок система совершает произвольные действия до получения вознаграждения, после чего стремится повторить «выгодный» шаблон. Авторы новой работы при обучении нейросети применили альтернативный подход, позволивший ей освоить одну из сложнейших видеоигр для приставки Atari 2600 — «Месть Монтесумы» (Montezuma’s Revenge). Из-за специфики геймплея она не впервые участвует в экспериментах с искусственным интеллектом: в этой игре редко встречаются положительные и доступные для оценки стимулы, такие как ключ для отпирания двери.
Чтобы упростить тренировку нейросети при прохождении игры с недостатком источников подкрепления, на первом этапе студенты обучили систему распознаванию команд на естественном языке, при этом фразы сопровождались скриншотом целевого действия игрового персонажа. Затем они передали алгоритму набор команд для прохождения каждой локации и позволили самостоятельно практиковаться. В рамках демонстрации авторы описали прохождение нейросетью комнаты с последовательностью команд типа «поднимись по лестнице» без доступа к данным о прошлых этапах обучения — это имитировало ситуацию первичного ознакомления с комнатой. Результаты показали, что искусственный интеллект верно интерпретировал команды и даже игнорировал некоторые из них при условии, что существует более оптимальная стратегия прохождения.
Эффективность предложенного подхода студенты оценили с помощью платформы для проектирования и сравнения алгоритмов обучения с подкреплением OpenAI Gym. Согласно сопоставлению, представленная нейросеть за время прохождения Montezuma’s Revenge набрала 3500 очков, тогда как показатель ближайшего конкурента составил 2500 очков. Тем не менее, максимальное значение по-прежнему остается за алгоритмом Google DeepMind — 6600 очков, — хотя обучение последнего потребовало двое больше времени. В последующем авторы статьи намерены сократить количество инструкций на естественном языке, необходимых для освоения нейросетями видеоигр, с тем чтобы сделать их более независимыми.
Подробности работы представлены на сервере препринтов arXiv.org.
Ранее международная группа исследователей представила компьютерную программу, которая самостоятельно научилась сложным тактикам игры в StarCraft. Так, система освоила тактику «Ударил-убежал», атаку прикрывающим огнем и сосредоточенный огонь по отдельным целям малыми группами. По мнению исследователей, алгоритм оптимально подходит для взаимодействия и тренировки с несколькими агентами.
Группа ученых из России и Германии математически описала ситуацию, когда происходит самоостановка света — явление, при котором скорость световых импульсов падает в миллионы раз, вплоть до нуля. Оказалось, что в определенных условиях излучение в резонансно поглощающей среде создает для себя «потенциальную яму», из которой затем не может выйти. Это происходит за счет обволакивания материей безмассовых фотонов, и в результате они могут остановиться.
Распространяясь в популяциях крупных жвачных животных, паразиты незаметно оказывают мощное влияние на целые экосистемы, позволяя растительности спокойно развиваться и процветать.
При помощи численного моделирования электромагнитных, механических и акустических процессов компания Tectonic Audio Labs создала современный динамик со сбалансированным излучателем (технология balanced mode radiator, или BMR). Динамик был использован в гарнитуре виртуальной реальности (VR) для корпорации Valve и теперь считается золотым стандартом для VR-аудио.
Ученые предупреждают: поскольку вес современных комбайнов и прочей сельхозтехники сегодня приближается к весу самых крупных животных, когда-либо бродивших по Земле, возникает парадокс уплотнения грунта.
Группа ученых из России и Германии математически описала ситуацию, когда происходит самоостановка света — явление, при котором скорость световых импульсов падает в миллионы раз, вплоть до нуля. Оказалось, что в определенных условиях излучение в резонансно поглощающей среде создает для себя «потенциальную яму», из которой затем не может выйти. Это происходит за счет обволакивания материей безмассовых фотонов, и в результате они могут остановиться.
Распространяясь в популяциях крупных жвачных животных, паразиты незаметно оказывают мощное влияние на целые экосистемы, позволяя растительности спокойно развиваться и процветать.
Крупнейшие патентные ведомства мира десятилетиями или веками принципиально игнорируют любые конструкции, нарушающие начала термодинамики. С точки зрения здравого смысла это хорошо, но конспирологи и гении-самоучки считают иначе. По их мнению, такая политика стала результатом заговора (подставьте сюда любое вымышленное или не очень секретное общество либо лобби). Что ж, похоже, Роспатент встал на их сторону.
С помощью GPS-трекинга ученые проследили за перемещениями целой популяции домашних кошек в небольшом норвежском городке. Оказалось, питомцы редко уходят от дома далее 50 метров и почти не совершают длительных прогулок.
Авторы нового исследования составили таблицу ожидаемой продолжительностью жизни для собак 18 чистокровных пород и метисов. Кроме того, они узнали, кто живет дольше — суки или кобели, кастрированные или нет.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
ПонятноИз-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
ПонятноНаши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
ПонятноМы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
ПонятноМы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.
Понятно
Комментарии