Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Нейросеть освоила видеоигру по языковому гайду
Студенты Стэнфордского университета разработали компьютерный алгоритм, который обучили проходить видеоигру посредством простых команд на английском языке.
В большинстве случаев при обучении искусственных нейросетей прохождению видеоигр используются алгоритмы с подкреплением — этот метод предполагает получение компьютером внешней обратной связи о своих действиях, например в виде зарабатывания очков. В процессе тренировок система совершает произвольные действия до получения вознаграждения, после чего стремится повторить «выгодный» шаблон. Авторы новой работы при обучении нейросети применили альтернативный подход, позволивший ей освоить одну из сложнейших видеоигр для приставки Atari 2600 — «Месть Монтесумы» (Montezuma’s Revenge). Из-за специфики геймплея она не впервые участвует в экспериментах с искусственным интеллектом: в этой игре редко встречаются положительные и доступные для оценки стимулы, такие как ключ для отпирания двери.
Чтобы упростить тренировку нейросети при прохождении игры с недостатком источников подкрепления, на первом этапе студенты обучили систему распознаванию команд на естественном языке, при этом фразы сопровождались скриншотом целевого действия игрового персонажа. Затем они передали алгоритму набор команд для прохождения каждой локации и позволили самостоятельно практиковаться. В рамках демонстрации авторы описали прохождение нейросетью комнаты с последовательностью команд типа «поднимись по лестнице» без доступа к данным о прошлых этапах обучения — это имитировало ситуацию первичного ознакомления с комнатой. Результаты показали, что искусственный интеллект верно интерпретировал команды и даже игнорировал некоторые из них при условии, что существует более оптимальная стратегия прохождения.
Эффективность предложенного подхода студенты оценили с помощью платформы для проектирования и сравнения алгоритмов обучения с подкреплением OpenAI Gym. Согласно сопоставлению, представленная нейросеть за время прохождения Montezuma’s Revenge набрала 3500 очков, тогда как показатель ближайшего конкурента составил 2500 очков. Тем не менее, максимальное значение по-прежнему остается за алгоритмом Google DeepMind — 6600 очков, — хотя обучение последнего потребовало двое больше времени. В последующем авторы статьи намерены сократить количество инструкций на естественном языке, необходимых для освоения нейросетями видеоигр, с тем чтобы сделать их более независимыми.
Подробности работы представлены на сервере препринтов arXiv.org.
Ранее международная группа исследователей представила компьютерную программу, которая самостоятельно научилась сложным тактикам игры в StarCraft. Так, система освоила тактику «Ударил-убежал», атаку прикрывающим огнем и сосредоточенный огонь по отдельным целям малыми группами. По мнению исследователей, алгоритм оптимально подходит для взаимодействия и тренировки с несколькими агентами.
Большему количеству учеников, чем когда-либо, трудно осваивать школьную программу. Это связано с низким уровнем развития рабочей памяти и неумением планировать время, считает педагог Алекс Куигли. В новой книге он дал практические рекомендации для учителей, которые помогут сделать работу в классе более продуктивной.
Экологи из Китая подсчитали, как изменились площади оазисов в мире с 1995 по 2020 год. Исследователи также выяснили, в каком регионе оазисных территорий больше всего, в каком темпе происходят изменения и чем на этих землях занимается человек.
Два типа телосложения у людей коррелируют с повышенной вероятностью развития колоректального рака. Это показало новое крупное исследование ученых-медиков из Европы и США.
Авторы нового исследования выявили три фактора, ответственные за так называемый алкогольный блэкаут — распространенное последствие употребления спиртных напитков, когда человек сталкивается с провалами в памяти.
По оценкам ученых, «свободных» планет в Млечном Пути может быть в 20 раз больше, чем звезд. Так как планеты сами не светятся, разглядеть их сложно: их ищут гравилинзированием, лучше всего обнаруживающим самые массивные планеты типа Юпитера. Но вот удалось найти еще одну такую «сироту», причем не массивную с Юпитер, а земного размера. И ученые уверены, что это лишь первая находка из многих.
Большему количеству учеников, чем когда-либо, трудно осваивать школьную программу. Это связано с низким уровнем развития рабочей памяти и неумением планировать время, считает педагог Алекс Куигли. В новой книге он дал практические рекомендации для учителей, которые помогут сделать работу в классе более продуктивной.
Режим работы, количество трудовых часов в неделю и экономическую стабильность профессии прочно ассоциируют с благополучием человека. Количественно и качественно определить эти взаимосвязи получается редко — нужны большие выборки респондентов и длительное время наблюдений. Автор новой научной работы использовал долговременное исследование более чем семи тысяч американцев, чтобы выявить основные эффекты паттернов трудовой деятельности на психическое и физическое здоровье работающих людей.
Американская компания JetZero, которая обещает произвести фурор в гражданской авиации, получила сертификат летной годности на испытания уменьшенной копии разрабатываемого ею сверхэффективного реактивного авиалайнера со «смешанным крылом». Предстоящая программа летных испытаний будет направлена на оценку летно-технических характеристик самолета, его устойчивости и управляемости.
Ученые из США и Швейцарии определили четыре ключевых механизма, задействованных в трансформации личности человека. Но ни один из них не сработает без самого главного — сильного желания измениться.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
ПонятноИз-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
ПонятноНаши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
ПонятноМы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
ПонятноМы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.
Понятно
Комментарии