Разработчики обучили искусственный интеллект принимать взаимовыгодные решения в кооперативных играх с помощью «пустых разговоров» — обмена несложными фразами-реакциями. При этом команды, состоящие из двух компьютеров, оказались более честными игроками, чем люди.
Международная группа исследователей протестировала алгоритм, обучающий компьютеры поиску взаимовыгодных решений. При проверке эффективности методики с участием людей выяснилось, что два компьютера способны договариваться между собой эффективнее, чем два человека. Разработчики считают, что их исследование в перспективе поможет в создании искусственного интеллекта с развитыми навыками общения с людьми.
Искусственный интеллект регулярно становится соперником человека в играх, где есть победитель и проигравший: в шахматах, шашках или го. Авторы новой работы решили проверить, насколько успешным окажется компьютер в кооперативных играх. В них игроки объединяют усилия, чтобы добиться наилучшего результата для всех членов команды.
Исследователи протестировали 25 существующих алгоритмов, анализирующих ходы и результаты в сыгранных партиях. В тестовых играх участвовали команды из двух компьютеров, двух людей или человека и компьютера. На первом этапе работы ни один из алгоритмов не сумел найти успешной долгосрочной стратегии игры, выгодной для обоих игроков в команде. На втором этапе исследователи добавили к условиям эксперимента возможность обмениваться небольшими сообщениями. Согласно теории игр, люди устанавливают кооперативные взаимоотношения в том числе с помощью «пустых разговоров» (cheap talk). Это тип коммуникации, не требующий больших усилий, но способный косвенно повлиять на ход игры. При удачном развитии событий компьютеры отправляли сообщения типа «Отлично! Мы разбогатеем!», при попытке нарушить договоренность — «Вы предали меня!».
При помощи таких сообщений алгоритм S# обучился корректировать ход игры и сотрудничать с партнером, добиваясь взаимной выгоды. К концу партии команды из двух компьютеров принимали взаимовыгодные решения в 100% случаев, а игроки-люди только в 60%. При этом компьютеры научились использовать «пустые разговоры» настолько естественно, что люди, попавшие в одну команду с компьютером, не могли с уверенностью определить, кто их партнер по команде — алгоритм или человек.
Исследователи считают, что их работа поможет использовать математические основы кооперации для разработки «социального» искусственного интеллекта, способного к сотрудничеству.
Исследование опубликовано в журнале Nature Communications.
Ранее исследователи из Университета штата Мичиган описали баланс между эгоцентричным и кооперативным поведением с помощью математической модели Изинга.