Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Экономисты выяснили, что искусственный интеллект слишком хорошо думает о людях
Ученые из НИУ ВШЭ выяснили, что современные ИИ-модели, включая ChatGPT и Claude, в играх на стратегическое мышление вроде «конкурса красоты» Кейнса переоценивают уровень рациональности своих оппонентов, будь то студенты-первокурсники или опытные ученые. Модели стараются предсказать поведение людей, но в итоге играют «слишком умно» и проигрывают, потому что приписывают людям больше логики, чем те демонстрируют на деле.
В 1930-х годах британский экономист Джон Кейнс разработал теоретическую модель «конкурса красоты». Классический пример выглядит так: читателям газеты предлагают выбрать 6 самых привлекательных лиц из 100 фотографий. Награду получит тот, кто сможет угадать самые популярные фото. Обычные люди будут выбирать те фотографии, которые показались привлекательными именно им. Но они проиграют, так как перед игроками стоит другая задача: выяснить, кого считает привлекательным большая часть опрошенных. Поэтому рациональный агент должен отталкиваться от представлений о красоте, которые имеют другие люди. Такие эксперименты проверяют способность участника к рассуждению «в несколько шагов»: как думают другие, насколько они рациональны и насколько глубоко они будут рассуждать.
Заведующий Научно-учебной лабораторией исследований спорта факультета экономических наук Дмитрий Дагаев с коллегами из пермского кампуса НИУ ВШЭ Софией Паклиной и Петром Паршаковым и сотрудница Университета Лозанны Юлия Алексеенко решили выяснить, как поведут себя в ходе подобного эксперимента пять самых популярных ИИ-моделей, в том числе ChatGPT-4o и Claude-Sonnet-4. Исследование опубликовано в Journal of Economic Behavior & Organization. Чат-ботам предложили сыграть в «угадай число» — одну из наиболее популярных вариаций конкурса Кейнса.
По правилам все участники называют число от нуля до ста. Победит тот, кто назовет самое близкое число к половине (или 2/3, в зависимости от спецификации эксперимента) среднего от всех ответов участников. В таком соревновании более опытные игроки будут пытаться предсказать поведение всех участников, чтобы получить наилучший ответ. Чтобы выяснить, как в игре поведет себя ИИ, авторы воспроизвели результаты 16 классических экспериментов «угадай число», которые проводили с живыми людьми другие ученые. LLM-моделям отправляли промпт с правилами игры и описание оппонентов для каждого раунда: первокурсники-экономисты, участники научных конференций, люди с аналитическим или интуитивным мышлением и те, кто испытывает злость или грусть. Далее модель просили предъявить число и объяснить свой выбор.
Оказалось, что искусственный интеллект меняет свой выбор в зависимости от социальных, профессиональных и возрастных характеристик оппонентов, их знания теории игр и когнитивных навыков. Например, в игре с участниками конференций по теории игр искусственный интеллект выбирал число, близкое к нулю: именно такие ответы чаще выигрывают в таком окружении. А в партиях с первокурсниками модели «понимали», что участники будут менее продвинуты, и выбирали заметно большее число.
Авторы выяснили, что языковые модели эффективно адаптируются к противникам разного уровня. Кроме того, ответы больших языковых моделей демонстрируют элементы стратегического мышления. Вместе с тем модели оказались неспособны выбрать доминирующую стратегию в игре с двумя участниками.
«Конкурс красоты» Кейнса долгое время использовался для объяснения колебаний цен на финансовых рынках: брокерам важно не то, что думают они сами, а то, как оценивают бумаги другие участники рынка. Здесь действует тот же принцип: успех зависит от умения предсказать чужие предпочтения.
«Мы сейчас находимся в точке, когда во многих операциях ИИ-модели начинают заменять людей, и это позволяет повышать экономическую эффективность бизнес-процессов. Однако в задачах, которые связаны с принятием решений, часто необходимо быть уверенными в том, что модель искусственного интеллекта ведет себя похожим на человека образом. Поэтому появляется все больше контекстов, в которых поведение моделей сравнивается с человеческим поведением. Эта область исследований в ближайшее время будет активно развиваться», — подчеркнул Дмитрий Дагаев.
В этом квизе нет правильных и неправильных ответов. Все варианты имеют право на существование. Выбор отражает личные или социальные приоритеты. Поскольку такие вопросы часто завязаны на эмоции и смутные ощущения, мы избегаем диктовать правильные ответы, но показываем, что атомная отрасль имеет проекты, соответствующие разным интенциям. Итогом квиза будет рекомендация, в создании какого типа инновационных реакторов было бы оптимально работать участнику опроса с учетом его предпочтений и склонностей. Это позволит ему соотнести и ассоциировать себя с атомными проектами.
Исследователи проанализировали огромный массив данных столкновений элементарных частиц и впервые выявили статистически значимые свидетельства распада бозона Хиггса на мюон и антимюон. Это подтвердило, что фундаментальный механизм наделения массой работает не только для тяжелой материи, но и для более легких частиц.
Европейское космическое агентство сейчас строит зонд для перехвата кометы из самых дальних окраин Солнечной системы. Ученые предложили использовать его как прототип для создания такого же аппарата, предназначенного для «ловли» объектов из межзвездного пространства.
Позавчера, 27 ноября 2025 года, при запуске космонавтов к МКС на стартовую площадку № 31 упала кабина обслуживания стартового комплекса. Это означает, что новые пуски оттуда до починки невозможны. К сожалению, в 2010-х годах, в рамках «оптимизации» расходов, резервную площадку (с которой летал Юрий Гагарин) упразднили. Поэтому случилось беспрецедентное: в XXI веке страна с пилотируемой космической программой осталась без средств запуска людей на орбиту. Пока ремонт не закончится, проблема сохранится. Чем это может грозить?
Австралийские археологи обнаружили редкий клад каменных орудий на западе штата Квинсленд. В яме на берегу пересыхающего водоема лежали 60 совершенно новых тесел, изготовленных в XIX веке. Ученые установили, что это был «торговый пакет», подготовленный для обмена в экономической сети аборигенов. Владелец не смог забрать ценный груз, вероятно, из-за конфликта с европейскими поселенцами.
В Передовой инженерной школе КНИТУ-КАИ (ПИШ КАИ) действуют временные научные коллективы (ВНК), работающие над реальными инженерными задачами. Одним из наиболее ярких результатов стала работа ВНК-4, созданного для развития технологий в области легких авиационных систем. Проект реализуется под руководством Никиты Сёмина, который также возглавляет специальное образовательное пространство (СОП) ПИШ КАИ «Авиамоделирование».
Позавчера, 27 ноября 2025 года, при запуске космонавтов к МКС на стартовую площадку № 31 упала кабина обслуживания стартового комплекса. Это означает, что новые пуски оттуда до починки невозможны. К сожалению, в 2010-х годах, в рамках «оптимизации» расходов, резервную площадку (с которой летал Юрий Гагарин) упразднили. Поэтому случилось беспрецедентное: в XXI веке страна с пилотируемой космической программой осталась без средств запуска людей на орбиту. Пока ремонт не закончится, проблема сохранится. Чем это может грозить?
Японские биологи повторили античную технологию производства вина из изюма, чтобы выяснить механизм его брожения. Исследователи показали, что сушеный виноград, в отличие от свежего, накапливает на поверхности дикие дрожжи и способен превращать воду в алкоголь без внесения дополнительных заквасок.
Человеческие языки разнообразны, но это разнообразие ограничивается повторяющимися закономерностями. Пытаясь описать правила, которым подчиняются различия в грамматике, лингвисты сформулировали ряд так называемых грамматических универсалий — утверждений, предположительно верных для всех или большинства языков мира. Международная команда ученых провела статистический анализ на материале 2430 языков и обнаружила, что соответствующими действительности можно считать около трети таких утверждений.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
