Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Экономисты выяснили, что искусственный интеллект слишком хорошо думает о людях
Ученые из НИУ ВШЭ выяснили, что современные ИИ-модели, включая ChatGPT и Claude, в играх на стратегическое мышление вроде «конкурса красоты» Кейнса переоценивают уровень рациональности своих оппонентов, будь то студенты-первокурсники или опытные ученые. Модели стараются предсказать поведение людей, но в итоге играют «слишком умно» и проигрывают, потому что приписывают людям больше логики, чем те демонстрируют на деле.
В 1930-х годах британский экономист Джон Кейнс разработал теоретическую модель «конкурса красоты». Классический пример выглядит так: читателям газеты предлагают выбрать 6 самых привлекательных лиц из 100 фотографий. Награду получит тот, кто сможет угадать самые популярные фото. Обычные люди будут выбирать те фотографии, которые показались привлекательными именно им. Но они проиграют, так как перед игроками стоит другая задача: выяснить, кого считает привлекательным большая часть опрошенных. Поэтому рациональный агент должен отталкиваться от представлений о красоте, которые имеют другие люди. Такие эксперименты проверяют способность участника к рассуждению «в несколько шагов»: как думают другие, насколько они рациональны и насколько глубоко они будут рассуждать.
Заведующий Научно-учебной лабораторией исследований спорта факультета экономических наук Дмитрий Дагаев с коллегами из пермского кампуса НИУ ВШЭ Софией Паклиной и Петром Паршаковым и сотрудница Университета Лозанны Юлия Алексеенко решили выяснить, как поведут себя в ходе подобного эксперимента пять самых популярных ИИ-моделей, в том числе ChatGPT-4o и Claude-Sonnet-4. Исследование опубликовано в Journal of Economic Behavior & Organization. Чат-ботам предложили сыграть в «угадай число» — одну из наиболее популярных вариаций конкурса Кейнса.
По правилам все участники называют число от нуля до ста. Победит тот, кто назовет самое близкое число к половине (или 2/3, в зависимости от спецификации эксперимента) среднего от всех ответов участников. В таком соревновании более опытные игроки будут пытаться предсказать поведение всех участников, чтобы получить наилучший ответ. Чтобы выяснить, как в игре поведет себя ИИ, авторы воспроизвели результаты 16 классических экспериментов «угадай число», которые проводили с живыми людьми другие ученые. LLM-моделям отправляли промпт с правилами игры и описание оппонентов для каждого раунда: первокурсники-экономисты, участники научных конференций, люди с аналитическим или интуитивным мышлением и те, кто испытывает злость или грусть. Далее модель просили предъявить число и объяснить свой выбор.
Оказалось, что искусственный интеллект меняет свой выбор в зависимости от социальных, профессиональных и возрастных характеристик оппонентов, их знания теории игр и когнитивных навыков. Например, в игре с участниками конференций по теории игр искусственный интеллект выбирал число, близкое к нулю: именно такие ответы чаще выигрывают в таком окружении. А в партиях с первокурсниками модели «понимали», что участники будут менее продвинуты, и выбирали заметно большее число.
Авторы выяснили, что языковые модели эффективно адаптируются к противникам разного уровня. Кроме того, ответы больших языковых моделей демонстрируют элементы стратегического мышления. Вместе с тем модели оказались неспособны выбрать доминирующую стратегию в игре с двумя участниками.
«Конкурс красоты» Кейнса долгое время использовался для объяснения колебаний цен на финансовых рынках: брокерам важно не то, что думают они сами, а то, как оценивают бумаги другие участники рынка. Здесь действует тот же принцип: успех зависит от умения предсказать чужие предпочтения.
«Мы сейчас находимся в точке, когда во многих операциях ИИ-модели начинают заменять людей, и это позволяет повышать экономическую эффективность бизнес-процессов. Однако в задачах, которые связаны с принятием решений, часто необходимо быть уверенными в том, что модель искусственного интеллекта ведет себя похожим на человека образом. Поэтому появляется все больше контекстов, в которых поведение моделей сравнивается с человеческим поведением. Эта область исследований в ближайшее время будет активно развиваться», — подчеркнул Дмитрий Дагаев.
Современная мобильная связь постоянно развивается, и операторы внедряют все новые поколения сетей. 30 марта для миллионов российских пользователей из Москвы, Санкт-Петербурга и Новосибирска началась новая цифровая эра. Абоненты из этих городов получили возможность протестировать связь 5G. Однако многие пользователи до сих пор не понимают, в чем принципиальная разница между поколениями — 4G и 5G. Ученый Пермского Политеха объясняет, что именно изменилось по сравнению с 4G и как это влияет на качество и доступность мобильного интернета.
Кошка может внезапно отказаться от корма, который ела месяцами, и все потому, что ей просто надоел его запах, пришли к выводу японские исследователи. Поэтому хозяевам стоит почаще вносить немного разнообразия в рацион, который они предлагают питомцу, вернее — в аромат, который пища источает.
Энтомологи сравнили устойчивость коммерческих и диких гибридных медоносных пчел к главному паразиту ульев — клещу варроа. Полевые и лабораторные тесты показали, что гибриды заражаются в пять раз реже, поскольку их личинки не нравятся паразитам. Пчела-гибрид выживает без регулярных химических обработок и, что важно для пчеловодов, сохраняет миролюбивый характер.
Когда международная экспедиционная группа, исследующая море Уэдделла в Антарктиде на борту ледокола «Поларштерн», попыталась укрыться от шторма, ученые и экипаж судна удивились внезапному появлению острова, не обозначенного ни на одной морской карте.
Энтомологи сравнили устойчивость коммерческих и диких гибридных медоносных пчел к главному паразиту ульев — клещу варроа. Полевые и лабораторные тесты показали, что гибриды заражаются в пять раз реже, поскольку их личинки не нравятся паразитам. Пчела-гибрид выживает без регулярных химических обработок и, что важно для пчеловодов, сохраняет миролюбивый характер.
Ученые давно знают как с хорошим приближением прогнозировать рост поверхностей. Но экспериментально подтвердить точное соответствие реальных процессов и модели — гораздо более сложная задача, у которой, тем не менее, есть решение.
В парках некоторых стран все чаще можно заметить странную картину: синицы и воробьи вместо пуха и веточек приносят в клювах сигаретные окурки. Орнитологи из Польши решили выяснить, зачем птицы выстилают гнезда мусором, пропитанным никотином. Оказалось, пернатые нашли способ использовать вредную человеческую привычку для защиты своего потомства. Но, как это часто бывает в природе, у медали есть обратная сторона.
Марсоход «Персеверанс» обнаружил в камнях на кромке кратера Езеро спектральные признаки минерала корунда, из которого на Земле образуются рубины и сапфиры. Такие спектры на Красной планете зарегистрировали впервые. Теперь ученые пытаются понять, при каких процессах он мог там сформироваться, ведь условия на Марсе заметно отличаются от тех, в которых корунд обычно образуется на Земле.
Четыре человека, летящие к Луне, столкнулись с целым рядом мелких неприятностей — от низкой температуры в начале работы до поломки мочевыводящей системы туалета на вторые сутки и необходимости взамен пользоваться пакетами. К счастью, пока самые крупные сложности удалось компенсировать. Но все они вместе могут сдвинуть ситуацию к решению, о котором Naked Science уже говорил в нашем видеоподкасте о миссии: не исключено, что при высадке астронавтов на Луне их корабль состыкуют со Starship не на окололунной, а уже на околоземной орбите.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
